Gemini Live наконец-то позволяет вам общаться с телефоном, как если бы это был настоящий человек и это впечатляет.
С ChatGPT, который в этом месяце запускает свой расширенный голосовой режим для избранных пользователей, пока Apple только готовится к запуску Apple Intelligence, Google ответила Gemini Live. Эта итерация Gemini AI позволяет вести естественный диалог с телефоном. В настоящее время Gemini Live доступен исключительно клиентам Gemini Advanced в рамках плана AI Premium за 20$ в месяц. Однако вскоре эта функция должна стать доступна всем подписчикам с совместимым смартфоном, а не только владельцам новеньких Google Pixel 9.
Наше первое впечатление от Gemini Live исключительно положительное. Наконец-то ИИ позволяет вести полноценный диалог со своим телефоном, функция, которой мы ждали с тех пор, как появились первые голосовые помощники, как Google Assistant, Siri и Alexa. В последние годы мы пользовались Siri и Alexa только для установки таймеров и воспроизведения музыки, поскольку их полезность ограничена, зачастую перенаправляя пользователя на веб-страницы после более сложных запросов. Gemini Live, напротив, позволяет общаться с помощником на разнообразные темы и получать содержательные ответы в процессе. Он понимает наши слова и намерения на совершенно новом уровне. Например, если мы спросим Gemini об успехах любой страны на недавних Олимпийских играх в Париже, он даст конкретный ответ. Если вы спросите его о рекомендациях по диете, он предложит варианты, исходя из ваших предпочтений.
Раньше мы могли задавать простые вопросы Gemini на Android-смартфоне, например, о погоде или простых математических задачах. Однако Gemini Live превосходит эти возможности на голову. С Gemini Live можно обсуждать сложные темы, проводить мозговой штурм идей или попросить совета. Разговор кажется естественным, и вы можете прервать ответ, если он становится слишком длинным. И пока это может показаться недостаточно вежливым, у машин ведь нет чувств. Кроме того, больше не нужно касаться экрана, чтобы взаимодействовать с Gemini, что делает его полностью бесконтактным, идеальное решение для многозадачности.
(Изображение предоставлено: Лэнс Уланофф)
Gemini Live также является мультимодальным, поэтому он может «смотреть» на изображения или видео вашего смартфона и отвечать на сопряженные с ними вопросы. Это может быть особенно полезно, если вы захотите сфотографировать что-нибудь, а затем спросить об этом у Gemini Live. Он умно анализирует изображения, чтобы предоставить соответствующие ответы. Несмотря на некоторые сбои в процессе живой демонстрации на мероприятии Made for Google, эта функциональность действительно полезна.
Google продолжает развивать Gemini, а в последующие недели разработчик обещает новые расширения с разнообразными приложениями, такими как Gmail и Календарь. Скоро вы сможете сказать: «Найди характеристики, которые Олег отправил мне по электронной почте пару недель назад», а Gemini сможет извлечь нужную информацию. Эта функция потенциально может стать переломным моментом для Gemini Live.
В целом, Gemini Live – самое впечатляющее приложение ИИ, что мы видели у Google на сегодняшний день. И пока Google вкладывает серьёзные средства в интеграцию ИИ в поисковые решения на базе AI Overview, это не то, что нам нужно. Мы не хотим, чтобы ИИ забивал наш поиск бесполезными ответами, когда мне нужна простая ссылка на веб-страницу. ИИ всё ещё может ошибаться, и Gemini не исключение. Мы хотим, чтобы ИИ подключился к улучшениям повседневной жизни. И пока большинство улучшений, которые сделают Gemini Live ещё лучше, на данный момент мы можем попрощаться с Google Assistant и наслаждаться содержательными разговорами с телефоном. Это действительно замечательно.