«Команда Siri безнадёжно отстала»: разработчики об анонсах конференции Google I/O 2018

Мнения представителей «ВКонтакте», Mail.Ru Group, ABBYY и других компаний.

«Команда Siri безнадёжно отстала»: разработчики об анонсах конференции Google I/O 2018

8 мая в Сан-Франциско началась трёхдневная конференция Google I/O, на которой компания представляет разработчикам новейшие продукты и технологии.

В первый день компания объявила о выходе бета-версии мобильной операционной системы Android P, рассказала о новых возможностях голосового помощника Assistant и продемонстрировала систему визуального ориентирования в дополненной реальности для карт Google.

Редакция vc.ru поинтересовалась у российских разработчиков какие анонсы Google заинтересовали их больше всего.

Сегодняшняя презентация Google прошла полностью под эгидой машинного обучения и искусственного интеллекта. Почти каждая представленная функция была про них. Теперь уже не так просто сделать что-то новое в области hardware, поэтому все гиганты активно развивают начинку своих железок и сервисы.

В этом году публично анонсировали ML Kit, который позволит разработчикам создавать приложения с нейронными сетями и другими крутыми функциями сразу под все платформы. Я думаю, это даст резкий прирост новых приложений в Google Play.

Впечатлила новая система Google Duplex (ассистент). Первый шаг — это когда боты начинают взаимодействовать с людьми. Следующим шагом будет общение самих ботов с другими ботами.

Это означает, что никаких публичных API создавать не понадобится. Боты будут общаться друг с другом на естественных языках. За этим будущее — и первый шаг уже сделан.

В остальном почти все анонсы — повсеместная интеграция распознавания голоса и внедрение автоматических подсказок. Всё больше персонализированного контента — теперь он не только в лентах новостей соцсетей, но даже в таких приложениях, как карты.

Александр Константинов, технический директор «ВКонтакте»

Google всё больше стремится попасть из мира компьютеров и смартфонов в реальный мир пользователей, в их дома, офисы, машины, пытаясь быть не только «персональным сервисом», но и «другом», который общается с людьми на человеческом языке, понимает юмор.

Особенно впечатлило бронирование столика в кафе и запись в парикмахерскую по телефону, которое целиком происходило с помощью «робота». Это совершенно другой уровень взаимодействия человека и машины.

По презентации заметно, что искусственный интеллект и машинное обучение становятся не просто трендом, а полноценной частью нашей жизни — AI for everyone.

В картах, чтобы подсказать дорогу или кафе, которое вам понравится, в фотографиях, чтобы улучшить снимок одним кликом, в операционной системе, чтобы дать возможность батарее дольше работать, в новостях, будильниках, приложениях, поиске.

Как разработчика меня порадовало большее число производителей смартфонов-участников бета-программы Android P, а значит на последней ОС выйдет много устройств, и не потребуется ждать несколько лет, когда большинство владельцев обновятся до новой версии.

Как специалиста в машинном обучении заинтересовала новость о том, что в Android появится фреймворк для простой работы с нейросетями. Он упростит портирование текущих нейросетей, которые развивает ABBYY. Это позволит дать пользователям новый опыт распознавания, извлечения данных и анализа текста на мобильных устройствах.

Заинтересовало обновление Google Lens: технология может узнавать в видеопотоке предметы по их очертаниям, подбирать похожие изображения одежды или интерьера.

ABBYY разрабатывает технологии, которые умеют распознавать в реальном времени тексты, в том числе с поверхностей различных предметов. Думаю, что сочетание этих возможностей может быть интересно для создания новых мобильных сервисов.

Игорь Акимов, руководитель отдела мобильных продуктов ABBYY

Конференция в этом году мало чем отличалась от предыдущих — это был очередной отчет о текущем статусе в эволюции компании.

Как настырный слон, Google прёт вперёд в развитии технологий искусственного интеллекта, интегрируя свои наработки практически во все ключевые продукты. Впрочем, это общемировой тренд, который заметен и в России.

Не может не радовать, что крошки и с большого стола мирового искусственного интеллектостроения достаются обычным пользователям.

Что касается новой Android P, то она тоже следует давнему тренду. Google который год продолжает бороться, причем небезуспешно, за сокращение энергопотребления своих устройств. В Android P для этого представлены очередные оптимизации, что лично для меня, как для пользователя Android-смартфона, — большой плюс.

И как водится, не обошлось без заимствования успешных решений у ближайшего конкурента (это у них взаимно). Представленная система управления жестами действительно похожа на новомодное управление в другом недавнем продукте.

Отдельно хочется сказать про Material Design. Google очень аккуратно подходит к его развитию: он выглядит продуманным и поступательным, без когнитивного диссонанса как для пользователя, так и для разработчика.

Сергей Ставский, руководитель направления мобильной разработки «Одноклассники»

Наверное, о впечатлениях от конференции напишут много и без меня, так как это очень индивидуально, а многие достижения Google в области машинного обучения публиковались до конференции, я отмечу лишь пару продуктов, которые мне очень понравились:

Google Duplex. Технология все ещё в разработке. Она звонит в фоне с телефона пользователя на реальный номер какому-то человеку и решает какие-то задачи. Это и есть то самое, чего мы все ждем от цифровых ассистентов — робот звонит в какое-то заведение и бронирует вам столик или записывает на стрижку и так далее. Человек на другой стороне провода даже и не знает, что говорит с роботом.

Google Slices. Я искренне верю, что приложения и магазины в текущем виде по большому счёту не нужны 90% пользователей смартфонов. Они превращают лаунчер в помойку, редко запускаются, в довесок есть много статистики о том сколько средний пользователь устанавливает приложений в месяц и так далее.

Как правило, пользователю нужны какие-то специфические функции из этих приложений. Slices со своей возможностью дать быстрый доступ к какой-то конкретной функции из приложения. Как раз движение в эту сторону и промежуточный этап до того как Google Assistant впитает в себя функции других приложений. А ещё я ненавижу процесс скачки и установки приложений, вот бы все это работало мгновенно как веб.

Google Lens. На конференции помимо стандартных функций вроде распознания объектов показали, как пользователь, наводя камеру на городскую улицу, получает с помощью VPS-технологии рекламу заведений и магазинов в дополненной реальности поверх реальных зданий. Борьба за этот рынок персонализированной виртуальной рекламы только началась, и Google тут успешно лидирует. Вы только представьте себе такси, где вместо окон дисплеи, и во время поездки вокруг все в рекламе — это же почти киберпанк.


В общем, моим следующим телефоном и экосистемой будет Google Pixel. Меня убедили Google и команда Siri, которая безнадежно отстала.

Денис Ширяев, менеджер продукта в ИД «Комитет»

Android P

Много внимания снова уделяется доступности приложений, а для новых пользователей смартфонов порог вхождения становится ниже. Android P — это более понятные контролы, значительно более удобный доступ к последним запущенным приложениям.

Google продолжила оптимизацию пользовательских сценариев, направленную на то, чтобы повседневные действия стали быстрее и проще. Используются предсказания на основе поведения пользователя и миллионов таких же, как он.

Как и каждый год, обещают оптимизацию батарейки, но мы-то с вами знаем, что такие оптимизации просто выкручивают руки разработчикам приложений при работе в фоне.

Google Assistant

Наконец-то боты будут делать ещё больше рутинной работы за меня. Google Assistant по моему запросу будет звонить в кафе и заказывать столик, если у этого кафе нет нормального сайта и формы бронирования. Для многих людей необходимость коммуницировать с живыми людьми по телефону является проблемой, особенно если человек находится за границей. Главное — не думать о том, сколько ещё данных получит Google.

Голосовые интерфейсы

Чем больше говорят про голосовые интерфейсы, тем сильнее хочется уже увидеть реализацию нейроинтерфейсов. Голос — удобный инструмент, но для частого использования он достаточно энергозатратный. Кроме того, общество (за исключением Азии) ещё не готово к разговорам с Google на людях.

Карты

Использование дополненной реальности при работе с картами — это просто бомба. Потребовалось несколько лет UX-исследований, чтобы понять, что человек не всегда знает, с какой стороны у дерева мох, и как продолжить движение на юг. Сейчас с помощью камеры Google проведет пользователя за руку.

Google Lens

Об этом уже давно говорили: увидел на конференции интересное устройство, навёл на него камеру, оно распозналось, и на экране сразу отобразилась ссылка на магазин, где его можно купить. Круто, что все это доступно onboard на мобильных устройствах.

Общее ощущение

В этом году Google явно не успевала к конференции, поэтому многие продуктовые запуски (кроме бета-версии Android P) даже в рамках раннего доступа будут доступны только в конце лета или осенью.

Каждый Google I/O несколько десятков основателей стартапов напиваются, узнав, что команда Google реализует их идею in-house.

Machine Learning Kit (ML Kit) выглядит очень перспективно. Уверен, многие компании уже придумали, где он может быть полезен.


Павел Лоуцкер, менеджер по продукту Mail.Ru Group

Снова искусственный интеллект и Google Assistant

Google Assistant теперь сохраняет контекст разговора, что способствует более естественному общению... эмм... с роботом. К тому же, Google научила его разговаривать по телефону вместо пользователя. Теперь вы разговариваете с ассистентом, а ассистент — с людьми. Идеально для интровертов.

Google News

Основное обновление: Unfiltered News — одинаковые новости для всех пользователей. Наконец-то кто-то в Google осознал проблему Filter bubble.

Android P

Машинное обучение для яркости подсветки? Больше машинного обучения богу машинного обучения. Что действительно порадовало — улучшенная навигация и Dashboard для приложений: статистика использования с возможностью ограничения по времени. Залипаете в игрушки? Теперь не будете. Наверное.

Карты

Google Maps теперь обладают системой визуального позиционирования (VPS). Функция интересная. Вопрос в том, где это будет нормально работать.

Lens

Технология позволит определять предметы при наведении камеры. Можно посмотреть, где купить подобную вещь или узнать больше информации о предмете.

Waymo

Снова машинное обучение. Автопилот сможет определить человека на дороге, даже если он не будет выглядеть как человек.

Предел достигнут, нет места для революции. Не осталось неохваченных паттернов, чтобы их улучшать. Может, развитие искусственного интеллекта породит новые взаимодействия, но пока все это мелкие косметические улучшения. Ничего революционного.

Денис Кармышаков

, руководитель отдела Android-разработки Touch Instinct

Google продолжает совершенствовать свои продукты с помощью искусственного интеллекта:

— подсказки текста в письмах в Gmail;

— поиск людей из пользовательского окружения в Google Photos и предложение поделиться с ними фотографиями, на которых они запечатлены.

Google Assistant получил более человечные голоса, возможность использования во время навигации в Google Maps. Внезапно — теперь ассистент сможет сам позвонить и назначить встречу, пользователь лишь раздаёт ему указания.

Не думаю, что звонки Google Assistant вместо человека получат широкое распространение в ближайшие пару лет, так как необходимо учитывать время звонка, стоимость и другие факторы.

В Android добавили функцию Adaptive Battery. Она следит и предсказывает, какие приложения пользователь будет использовать в течение ближайших двух часов, и благодаря этому экономит заряд батареи.

Появились App Actions, которые помогут приложениям приспособиться к поведению пользователя и быстрее попадать в нужное приложение. Навигация в Launcher теперь направлена на жесты, а не кнопки.

Сегодня Google движется в сторону искусственного интеллекта. Улучшает с его помощью свои продукты и систему Android в целом. В презентации приложениям уделили мало внимания, скрестили пальцы и ждём Developer Keynote, а то как-то грустно.

Михаил Баранников, Android-тимлид в компании e-Legion

В этом году в Google продолжили то, что провозгласили на I/O в прошлом году (подход AI first) и сделали основной упор на искусственном интеллекте. Анонс Android P мало чем зацепил. Внешне наблюдается некоторое движение в сторону iOS.

Наибольший интерес вызвали Google Maps и Waymo. На этих докладах показали, как предложенные ранее технологии могут найти практическое применение.

Но это был продуктовая презентация, для меня же, как для разработчика, всё самое интересное только начинается — технические доклады будут позже.

Виталий Никоноров, Android-разработчик «Ситимобил»

Google I/O в этом году почти ничем не удивил, даже немного разочаровал. Судя по всему, стратегия компании не изменилась, и она продолжает внедрять в свои продукты технологии машинного обучения. Никаких новых устройств, жаль.

Как и в прошлом году, компания рассказала об улучшениях Google Assistant и Google Photos. Очень много времени уделили ассистенту, он меня интересует больше всего. Показали в нём много крутых функций, но не факт, что они дойдут до России.

Ожидал каких-нибудь новостей о сроках запуска ассистента на русском языке, потому что подготовка к этому событию уже во всю идет со стороны разработчиков.

Вполне ожидаемо официально выпустили бета-версию Android P. Порадовало, что больше всего внимания уделили удобству пользования смартфоном и его контролю, и как всегда, не обошлось без оптимизации расхода батареи. «Украли» управление жестами из iPhone X, это мне понравилось. Slices уже были представлены в официальном блоге для разработчиков: будем внедрять в свои приложения, за этим будущее.

Вячеслав Крайнов, Android-разработчик ИД «Комитет»

Сегодня компания Google показала нам искусственный интеллект, искусственный интеллект и ещё с десяток раз искусственный интеллект. Не удивительно, что большую часть времени рассказывали про «умного» ассистента и функции Android.

Общение в режиме диалога, распознавание нескольких команд в одном предложении, помощь в составлении писем, обработке фотографий, организации дня и подборке новостей — всё это очень круто выглядит, по крайней мере, в теории, и продаёт.

Как всё это будет работать на самом деле — никто не знает. Будут ли теперь люди получать шаблонные письма от друзей? Раскрасят ли все чёрно-белые фотографии? Будут ли получать действительно только те новости, которые интересны им? Не пропустят ли какое-то важное событие? Начнут ли ассистенты общаться между собой?

В демонстрации, где система звонила и записывала человека на стрижку, нетрудно представить такую же систему, ей отвечающую. А как это будет выглядеть в будущем?

Представьте, после очередного селфи телефон понимает, что волосы у вас порядочно отрасли, и сам записывает вас к мастеру, а потом сообщает, что на выходных не помешало бы постричься. Конечно, зависит от интерпретации, но для меня это похоже на «Эй, ребята, тут мой человек стал неряшливо выглядеть, давайте-ка приведём его в порядок».

Мне было бы интереснее послушать про диагностику болезней с помощью анализа сетчатки глаза и искусственный интеллект в медицине в общем, но, к сожалению, этой стороне посвятили только пару минут презентации.

Зато достаточно подробно разобрали примеры использования ИИ в беспилотных автомобилях. Ирония состоит в том, что именно сегодня компания Uber огласила результаты внутреннего расследования аварии со смертельным исходом — виноват был не человек, а алгоритм.

Я думаю, через десяток лет придут к идее дорог раздельного пользования, так как только это поможет избежать подобных ситуаций и достичь максимальной эффективности автоматических перевозок.

Большинство показанных наработок не новы и являются комбинацией, улучшением или переосмыслением уже существующих. По большому счёту, и Google, и Apple движутся в одном направлении, только по-разному преподносят результаты. Чем Google смогла удивить, так это введением философской концепции Digital Wellbeing – «Цифрового самочувствия».

По их заявлению, цель – превратить модный в наши дни невроз FOMO (Fear Of Missing Out) в JOMO (Joy Of Missing Out). Я бы назвал это phone-life balance, и тут они, пожалуй, впереди.

В их видение Digital Wellbeing входит анализ использования телефона, принудительное прерывание долгих сеансов просмотра YouTube, комбинирование нескольких уведомлений в одно и так далее. Особенно классно, что если положить телефон экраном вниз, то он полностью замолкает. Мне кажется, это одна из важнейших функций, которых не хватает современным людям.

Станислав Литвинов, старший преподаватель «Университета Иннополис»

Презентация была захватывающей: помощь людям, ИИ, Assistant, новый более удобный Android, чтение слов камерой и многое другое. Google умеет делать презентации.

Наибольший интерес привлек искусственный интеллект. Всё больше приложений Google получают поддержку ИИ для выполнения задач. Но что приятно, фокус сместился с попытки удивить на функции, которые действительно делают жизнь людей лучше.

Это и помощь докторам ставить диагнозы на основе машинного обучения и огромного количества данных, и распознавание текстов из реального мира, и адаптация работы системы под пользователя.

Digital Wellbeing — это раздел, который направлен на то, чтобы помочь людям быть более здоровыми в мире технологий. Dashboard в Android P поможет проанализировать привычки, а искусственный интеллект в системе может помочь с улучшением ситуации. Можно установить лимит времени использования приложений. А функция Wind Down в заданное время сделает экран черно-белым, чтобы «уговорить» лечь спать.

Впечатлило, что сделали шесть голосов для ассистента. Причём они звучат естественно. И тут тоже не обошлось без ИИ. А один из голосов – это Джон Ледженд, что очень приятно, я люблю его творчество.

Множество усовершенствований в Assistant. Но больше всего впечатлило то, что он может сам звонить и говорить по телефону. Это позволит ему сделать заказ за нас даже в тех местах, где нет системы онлайн-заказов. А чтобы повысить точность времени работы заведений, Google может сделать автозвонок, и весь мир получит свежую информацию.

В прошлогоднем Keynote было больше нововведений, но они были размытыми. В этом же году больше конкретики, хоть и сосредоточенной на нескольких областях.

Василий Чирвон, Android-тимлид в компании MobileUp

Давайте пропустим предметы интерьера, с которыми можно говорить, и повторяющие конкурентов функции, а также социальную ответственность в формате digital wellbeing, и перейдем к самому интересному.

Google Assistant теперь сможет сам позвонить и забронировать столик для тебя и твоих друзей, обсудив нюансы с персоналом заведения. Голосом, будто он действительно твой живой помощник.

Это большой шаг: Google вводит в обиход общение живых людей и роботов-ассистентов. Если вы стеснялись заговорить с роботом — расслабьтесь, он заговорит с вами первым, и не факт, что вы сразу поймете, что это робот.

Так от digital wellbeing совсем недалеко до digital madness. Видимо, в Google наигрались с очками и поняли, что практическое применение технологии дополненной реальности можно воплотить через старый добрый смартфон.

Теперь только камера нужна, чтобы понять, перед каким зданием ты стоишь, где купить такие же кеды, как на твоем знакомом, сколько стоит диван в прихожей твоих друзей, как переводится меню в этом тайском ресторанчике. Всё это мы видели много раз по отдельности, но теперь все фичи в одном месте — бери и пользуйся.

Кажется, у Google получилось лучше остальных вывести то, что сейчас называется искусственным интеллектом. Они дают пользователям не эмодзи, повторяющие движения за их лицом, а стремятся обогатить реальность возможностями, с которыми хочется не поиграть и забыть, а действительно пользоваться.

Игорь Павлов, менеджер по продукту компании Fasten

Google делает упор на машинное обучение, на I/O представлены
— проект по распознаванию болезней по фотографии сетчатки глаза;
— голосовой помощник самостоятельно делает звонок и назначает визит к парикмахеру и бронирует стол в кафе (если это не постановка, то тест Тьюринга пройден);
— камера, которая распознает местность, делая более точной навигацию, а также предметы (пририсоывавая ценники к ним в VR).
Показан новый лаунчер для Android P, в котором пересмотрели контроль громкости, заблокировали автопереворот экрана и заменили софт-кнопки навигации жестами. Система также не избежала машинного обучения — теперь оно анализирует действия пользователя и подсказывает ему следующее действие или приложение. А ещё как-то управляет режимом энергосбережения и еще лучше управляет автонастройкой яркости экрана. Для разработчиков
добавили поддержку библиотеки машинного обучения tensorflow ligth в виде готового SDK .

Дмитрий Самойленко, Android-тимлид в онлайн-кинотеатре ivi
1717
46 комментариев

97% процентов до сих пор ниже 7 версии, может научат нейросеть делать прошивки?

31
Ответить

Откуда инфа про 97 процентов? Судя по официальному дашборду (https://developer.android.com/about/dashboards/), только 63.2

А вообще это сильно зависит от аудитории, у нашего приложения около 85% на 7-й и 8-й версиях Андроида, судя по Google Analytics.

4
Ответить

В андроид о обещали сделать обновления быстрыми(project treble), правда в основном для устройств которые выходят уже с о. Посмотрим на сколько хорошо это сработало

Ответить

Робот, звонящий в парикмахерскую, — это как робот на респешене отеля — со стороны смотрится как «вау», а по сути — «костыльное» решение, поскольку звонков в парикмахерскую для бронирования времени в светлом мире будущего быть не должно (всё должно решаться взаимодействием программных интерфейсов, пусть и после голосовой команды владельца смартфона).

13
Ответить

А пусть эти роботы на почту России и в поддержку Билайна звонять - роботы должны говорить с роботами :)

8
Ответить

Так мы про сегодня, не про будущее, само собой звонки в будущем не нужны, но мы пока находимся на стадии когда курьер уточняет дорогу через раз, так что явно есть где Duplex применить

2
Ответить

Нет смысла в супер-умных голосовых помощниках, новостных лентах и прочих сомнительных преференциях, когда ваша операционная система — решето, вендоры вытирают о своих клиентов ноги, выключая обновления безопасности через год, а любой проходимец за 25 долларов может заполнить магазин дистрибуции скамом.

22
Ответить