Keep making magic. С этой фразы вчера началась презентация Google I/O 2019, и она вполне может стать слоганом компании. Нам продемонстрировали новые достижения инженеров Google в области искусственного интеллекта, которые призваны изменить наше восприятие обыденных вещей. Вкратце обо всех них в этом материале.
О новых смартфонах Pixel 3a и 3a XL, а также о смарт-дисплее Nest Hub Max мы рассказали вчера, поэтому здесь все, что касается новинок в сфере программного обеспечения. Кстати, также можете посмотреть видеообзор вчерашней презентации.
Начнем с того, что в скором времени Google сможет выдавать в результатах поиска 3D-модели интересующих вас вещей или объектов. Более того, эти модели можно будет “перетащить” в реальный мир. Это поможет, к примеру, оценить, подойдет ли новая обувь под ваш прикид, или увидеть белую акулу в реальном размере.
Технология Google Lens теперь будет полезна, если вы пришли в кафе или ресторан, но не знаете, что выбрать из меню. Если вы наведете смартфон на меню, Lens подсветит самые популярные позиции, фотографии которых сразу же можно посмотреть. Еще одна полезная фишка – при наведении Lens на чек технология посчитает итоговую сумму, чаевые и позволит разделить счет на несколько человек, если это потребуется. Также в скором времени Lens сможет “оживлять” страницы журналов, воспроизводя видео вместо картинок.
Камера Google Go – это, фактически, Google Lens для бюджетных устройств. Она способна распознавать текст, озвучивать и переводить его, что может существенно облегчить жизнь.
О технологии Google Duplex, думаю, слышали все. Так вот она станет еще круче. Duplex on the Web теперь распространяется на различные онлайн-сервисы компании. К примеру, технология сможет забронировать вам автомобиль, используя информацию из вашего календаря и почты о предстоящей поездке. Таким образом, Duplex сможет сэкономить вам уйму времени на заполнение всех полей. На первых порах технология сможет бронировать автомобили и билеты в кино и будет доступна лишь в США и Великобритании.
А вот виртуальный помощник Google Assistant этой осенью существенно преобразится. Скорость его работы существенно увеличится (в ряде задач в 10 раз). Также он сможет обрабатывать команды без постоянной фразы-триггера “Hey Google”. Плюс к этому ассистент научится работать сразу с несколькими приложениями, понимать контекст, отвечать на сообщения и многое другое. Next Generation Google Assistant появится на новых смартфонах Pixel осенью этого года, причём какое-то время будет эксклюзивом для новых смартфонов.
Вчера я вам рассказывал о новом смарт-дисплее Nest Hub Max, так вот для этой категории устройств скоро будет доступна функция Picks for you. Google Assistant будет выдавать персонализированные результаты поиска для каждого пользователя на основе предыдущих запросов (рецепты, подкасты и т.п.).
Еще одно нововведение для Google Assistant – режим Driving Mode. Достаточно обратиться к своему виртуальному помощнику с фразой “Hey Google, let’s drive”, и его интерфейс преобразится. Значки и кнопки станут крупнее, чтобы водителю было легче и комфортнее их воспринимать во время езды. Новая функция должна появиться у пользователей в ближайшие недели.
Следующая фича точно понравится владельцам смарт-колонок или смарт-дисплеев от Google. Теперь чтобы выключить будильник достаточно одного слова — “Стоп”. Больше не нужно говорить “Okay Google, stop alarm”. Функция уже должна работать у всех пользователей.
В настройки Google-аккаунта теперь будет легче попасть из различных приложений Google. Достаточно будет тапнуть на свой аватар.
В Google Maps и YouTube появится Incognito Mode, что позволит пользователям искать интересующую информацию без сохранения истории.
Начиная со вчерашнего дня Android-смартфон можно использовать для двухфакторной аутентификации Security Key. А владельцы Pixel теперь могут опробовать AR-навигацию в Google Maps (работает, правда, пока не во всех локациях, а лишь “в крупных городах”).
Функция Smart Reply отныне доступна не только для приложений от Google, но и для любых мессенджеров в Android Q. Более того, будут предлагаться не только ответы и эмодзи, но и действия (открыть Maps/Calendar и т.п.).
Технология машинного обучения Federated Learning теперь интегрирована в Gboard. Она анализирует использование различных слов пользователями, в том числе определяет, какие новые слова или сокращения становятся более популярными, после чего начинает их предлагать в клавиатуре. При этом всём никакие данные о пользователях не отправляются в облако Google. Используются только апдейты, которые вычисляет смартфон. Именно они и улучшают глобальную модель Google.
Android 10 Q пока не получил официального названия (пишите свои варианты в комментариях), зато обзавелся третьей бета-версией, которая доступная для загрузки. Более того, установить ее могут не только владельцы устройств Pixel, но и смартфонов Asus ZenFone 5Z, Essential PH-1, HMD Global Nokia 8.1, Huawei Mate 20 Pro, LG G8 ThinQ, OnePlus 6/6T/7, Oppo Reno, Realme 3 Pro, Sony Xperia XZ3, Tecno Spark 3Pro, Vivo X27, Vivo NEX S, Vivo NEX A, Xiaomi Mi Mix 3 5G и Xiaomi Mi 9. В общей сложности 23 устройства.
Что касается нововведений в Beta 3, появилась кнопка активации темной темы (в меню быстрых настроек), полностью жестовая навигация (с возможностью также выбрать двух- или трехкнопочную навигацию), менеджер управления разрешениями, отдельное меню настроек Privacy, содержащие различные настройки безопасности. Также в скором времени появится родительский контроль в меню Digital Wellbeing, режим Focus Mode (позволяет выбрать, какие приложения не должны вас беспокоить при его активации), функция Live Caption (о ней речь будет идти чуть ниже). Еще одно полезное нововведение – установка патчей безопасности будет проходить в фоне и не будет требовать перезагрузки смартфона.
Приложение Live Transcribe, которое пока что находится в разработке, помогает людям с проблемами слуха распознавать речь их собеседников. Это позволяет им обходиться без переводчиков и облегчает процесс коммуникации.
Технология Live Caption, в свою очередь, позволит активировать субтитры для любых видео и аудио, которые вы воспроизводите на своем смартфоне. Подобная функциональность есть у YouTube, где пользователи могут включать субтитры для любых видео. Теперь же такая опция появится у владельцев Android-смартфонов. При вызове меню регулировки громкости добавится кнопка Live Caption. Работать она, к слову, будет даже без интернет-соединения.
Функция Live Relay еще больше пригодится людям, у которых есть проблемы со слухом. Она поможет им нормально общаться по телефону. Когда пользователь с активной функцией Live Relay будет брать трубку, виртуальный ассистент предупредит собеседника, что всё, что он скажет, будет преобразовано в текст на экране. Отвечать же на него можно будет обычным вводом текста или заготовленными фразами, которые будут озвучены для собеседника. Очень круто.
Еще одна крутейшая инициатива – Project Euphonia. Это технология, которая анализирует фразы людей, у которых есть проблемы с речью, а потом преобразовывает их в текст для лучшего понимания собеседника. Более того, Project Euphonia помогает и людям, которые вовсе не могут говорить. ИИ анализирует звуки, которые люди могут воспроизвести, или же их движения, взгляды на виртуальную клавиатуру, чтобы трансформировать это все в обычную речь.
Также на вчерашней презентации нам рассказали о методике предварительной тренировки систем обработки языка BERT (Bidirectional Encoder Representations from Transformers). Это нейронная сеть, с помощью которой можно создавать программы с ИИ для обработки естественного языка. Кроме того, машинное обучение Google используется и для медицинских целей. К примеру, ИИ смог спрогнозировать развитие рака легких у пациента за год до того, как его обнаружили врачи. Пока что технология находится на стадии ранней разработки, но в будущем может более широко использоваться в онкологии. Еще один пример использования машинного обучения – прогнозирование стихийных бедствий, таких, как наводнения. Система способна моделировать наводнения и, в случае опасности для людей, рассылать им соответствующие предупреждения.
Во время вчерашней презентации глава Google Сундар Пичаи и его коллеги неоднократно подчеркивали, что вся их команда стремится сделать Google более полезным для всех. И глядя на такие технологии, как Live Caption, Live Relay, разработки Project Euphonia и прочие инициативы, действительно веришь этому, и вместе с тем осознаешь, насколько громадные перспективы у современных технологий.
Продолжайте создавать магию, Google. У вас это хорошо получается.