Как Google теряет контроль

После многих лет компания спешит со своей стратегией ИИ, поскольку ее конкуренты вышли вперед. Ирония в том, что все это происходит потому, что Google думал, что загнал рынок в угол.

Смотрите, в 2017 году исследователи Google опубликовали статью “Внимание — это все, что вам нужно”, в которой представлена концепция трансформатора и значительно улучшены возможности моделей машинного обучения. Вам не нужно знать техническую сторону, но это оказало огромное влияние и дало новые возможности; достаточно сказать, что это T в GPT.

Вы можете спросить, почему Google отдал эту замечательную вещь бесплатно? В то время как крупные частные исследовательские организации в прошлом подвергались критике за сокрытие своей работы, тенденция последних нескольких лет была направлена на публикацию. Это игра престижа, а также уступка самим исследователям, которые предпочли бы, чтобы их работодатель не прятал свои достижения. Вероятно, в этом также есть элемент высокомерия: изобретя технологию, как Google мог не использовать ее наилучшим образом?

Возможности, которые мы видим в ChatGPT и других крупных языковых моделях сегодня, не сразу последовали. Чтобы понять и воспользоваться преимуществами нового инструмента, требуется время, и каждая крупная технологическая компания приступила к изучению того, что может предоставить новая эра ИИ, и что для этого нужно.

Помощь помощнику

Нет никаких сомнений в том, что Google посвятил себя работе с ИИ, как и все остальные. За следующие несколько лет компания добилась серьезных успехов в разработке вычислительного оборудования для искусственного интеллекта, создала полезные платформы для разработчиков для тестирования и разработки моделей машинного обучения и опубликовала тонны статей обо всем, от эзотерических настроек модели до более узнаваемых вещей, таких как синтез голоса.

Но возникла проблема. Многие об этом от сотрудников Google и других представителей отрасли, но в том, как работает компания, есть своего рода феодальный аспект: передача вашего проекта под эгидой существующего основного продукта, такого как Maps или Assistant, — это надежный способ получить деньги и персонал. И поэтому кажется, что, несмотря на то, что многие из лучших исследователей ИИ в мире были привлечены, их талант был направлен в русло корпоративной стратегии.

Посмотрим, чем это обернулось? Вот небольшая временная шкала:

В 2018 году они продемонстрировали постепенные улучшения в Google Assistant Flow, Photos (например, раскрашивание монохромных изображений) , интеллектуальный дисплей с “визуальной версией Assistant”, Помощник в Картах, Google News с поддержкой искусственного интеллекта и (к их чести) MLKit.

В 2019 году обновленный и увеличенный смарт-дисплей, результаты поиска AR, карты AR, обновления Google Lens, Duplex для Интернета (помните такой?) , сжатый Google Assistant, который работает более локально, помощник в Waze, помощник в режиме вождения, субтитры в реальном времени и ретрансляция в реальном времени (распознавание речи) и проект, чтобы лучше понимать людей с нарушениями речи.

Безусловно, некоторые из этих вещей великолепны! Однако большинство из них «просто были» , но с поддержкой ИИ. Оглядываясь назад, многие чувствуют себя немного неловко. Вы действительно видите, как крупные компании, такие как Google, действуют в плену тенденций, а также управляемы ими.

Между тем, в феврале того же года у нас также был заголовок: “OpenAI создал настолько хороший генератор текста, что его считают слишком опасным для выпуска”.Это был GPT-2. Не 3, не 3,5, а 2.

В 2020 году Google создал клон Pinterest на базе искусственного интеллекта, а затем в декабре уволил Тимнита Гебру, одного из ведущих специалистов по этике ИИ, из-за статьи, в которой указывались ограничения и опасности технологии.

Честно говоря, 2020 год не был удачным для многих людей — за заметным исключением OpenAI, соучредителю которого Сэму Альтману пришлось лично подавить шумиху вокруг GPT-3, потому что она вышла за пределы допустимых уровней.

В 2021 году дебютировала собственная большая языковая модель Google LaMDA, хотя демонстрации на самом деле не продавали ее.

OpenAI начал год с демонстрации DALL-E, первой версии модели преобразования текста в изображение, которая вскоре станет именем нарицательным. Они начали показывать, что LLM с помощью таких систем, как CLIP, могут выполнять не только языковые задачи, и действовали скорее как универсальный механизм интерпретации и генерации.

В 2022 году появится больше настроек в Assistant, больше интеллектуальных дисплеев, больше дополненной реальности на Картах и 100 миллионов долларов на приобретение изображений профиля, созданных искусственным интеллектом. OpenAI выпустила DALL-E 2 в апреле, а ChatGPT - в декабре.

В какой-то момент в начале 2022 года, руководители Google открыли глаза, и то, что они увидели, напугало их до чертиков.

Доказательством этого является вывод Imagen через месяц после DALL-E 2, хотя, как и практически любое другое интересное исследование ИИ, опубликованное Google, оно было недоступно для тестирования, не говоря уже о подключении к API. Google выпустил Imagen Video. Riffusion создал waves для создания музыки, а месяц спустя появился MusicLM (который вы не можете использовать) .

Но, конечно же, именно ChatGPT заставил руководство Google быстро перейти от беспокойства к полному провалу.

Всем участникам было бы ясно, что этот вид разговорного ИИ категорически отличается от продуктов-помощников, в которые Google инвестировал в течение десятилетия, и на самом деле делал то, на что претендовали все остальные псевдо-ИИ (фактически просто интерфейсы на естественном языке для набора API) . Это то, что называется экзистенциальной угрозой.

Удача или предвидение?

Достаточно того, что кто-то другой, какой-то выскочка, невосприимчивый к приобретениям, запустил следующий этап эволюции поисковой системы, и что они сделали это публично, что захватило воображение всех, от лидеров отрасли до тех, кто избегает технологий. Настоящий поворот ножа неожиданно пришел от Microsoft.

Называть Bing “конкурентом” Google Search, пожалуй, слишком великодушно — с примерно 3% глобального поиска по сравнению с 92% у Google. Microsoft, похоже, отказалась от каких-либо иллюзий относительно способности Bing улучшить свое положение и обратилась за помощью за пределы собственного дома. Были ли их инвестиции в OpenAI сверхъестественным предвидением или счастливой случайностью, в какой-то момент стало ясно, что они поставили на быструю лошадь.

Возможно, в какой-нибудь прокуренной комнате Сатья Наделла и Сэм Альтман сговорились исключить Google из своего нового мирового порядка, но на публике разговор принял форму денег, и их было много. Какой бы ни была предыстория, Microsoft заручилась поддержкой инновационного новичка, а вместе с ним и возможностью использовать свои технологии там, где они принесут наибольшую пользу.

Хотя мы видели несколько интересных идей о том, как генеративный ИИ может помочь в повышении производительности, программировании и даже управлении, их еще предстоит доказать, либо из-за проблем с авторским правом, либо из-за склонности ИИ быть слишком “креативным” в своих ответах. Но, учитывая надлежащие ограждения, он явно был очень хорош в обобщении информации, чтобы ответить практически на любой вопрос, от простых фактических запросов до сложных философских.

Поиск объединил потребность Microsoft в инновациях, чтобы продвинуться вперед с основной компетенцией больших языковых моделей, которые по счастливой случайности или здравому смыслу он только что выбрал в качестве партнера ведущего мирового разработчика. Переход на интеграцию новейшей модели GPT (некоторые называют ее GPT-4, но я подозреваю, что OpenAI сохранит это прозвище для своей собственной модели первого производителя) с Bing и Edge — это своего рода вынужденное приветствие Марии, его последняя и лучшая игра в мире поисковых систем.

Google, явно встревоженный, попытался спойлерить кампанию с помощью бессмысленного сообщения в блоге за день до того, как Microsoft запланировала свое большое мероприятие, объявляющее о запуске Bing на базе OpenAI. Bard, по-видимому, название конкурента ChatGPT от Google, базирующегося в LaMDA, было представлено в типично щадящей манере. Обещания возможностей и никаких жестких сроков.

Эта попытка анонса, похоже, была сделана в такой спешке, что ее содержание едва упоминалось на мероприятии Google «Поиск и искусственный интеллект” два дня спустя, и, действительно, она также избежала проверки фактов, которую вы хотели бы сделать, если бы рекламировали будущее knowledge graph. Изображение, использованное для иллюстрации Барда, содержало нетривиальную ошибку, в которой говорилось, что космический телескоп Джеймса Уэбба »сделал самые первые снимки планеты за пределами нашей солнечной системы”. Это неправда, и тот факт, что этот хваленый машинный интеллект ошибся, и что никто в Google не заметил или не позаботился о проверке, похоже, напугал инвесторов.

Поспешность Google и столь явные сбои говорят о недостаточной готовности даже на ограниченном экспериментальном уровне, не говоря уже о глобальном развертывании, подобном тому, которое Microsoft уже начала.

В своем обращении к инвесторам генеральный директор Сундар Пичаи сказал: “Я думаю, что вижу в этом шанс переосмыслить и переосмыслить Поиск, чтобы решить больше вариантов использования для наших пользователей. Это только начало, но вы увидите, как мы проявляем смелость, публикуем информацию, получаем отзывы, повторяем и улучшаем ситуацию” . Похоже ли это на человека с планом?

Понятно, что Google не хотел бы убивать курицу, несущую золотые яйца, преждевременно объединяя Поиск с любым полу приготовленным LLM общего пользования, который у них есть. Они стали экспертами в развертывании узкоспециализированного ИИ, моделей задач, которые выполняют одну или две задачи. Но когда дело доходит до большого шага, их удобное положение обременяет их инерцией.

Это падение Google? Конечно, нет, он останется по умолчанию и баснословно прибыльной. Но доверие инвесторов пошатнулось, поскольку выяснилось, что неспособность Google к осмысленным инновациям за последние несколько лет, возможно, была вызвана не мудростью и уверенностью, а сдержанностью и гордостью.

Перевод статьи "Google is losing control" by Devin Coldewey

0
7 комментариев
Написать комментарий...
Невероятный Блондин

Скачал твою сырую, неформатированную простыню генерированного текста.

На будущее, делай вычитку и дописывай пропущенные слова и буквы. 👎🏼

Ответить
Развернуть ветку
Степан Самойлов
Автор

Извините, я только учусь и начинаю. Принимаю любую критику!

Ответить
Развернуть ветку
Невероятный Блондин

Удалил.

Ответить
Развернуть ветку
Инесса Погорельцева

Здравствуйте.Хотела с вами поговорить по поводу венчурных фондов

Ответить
Развернуть ветку
Gogi Jan

Чатгпт лучше бы написал

Ответить
Развернуть ветку
Алексей Полунин

Похоже, что это будующее статей. Платформам типа vc придется вводить оценку на генеративность текста при публикации и отмечать тексты написанные людьми с соответствующим фильтром для пользователей.

Ответить
Развернуть ветку
Jiu and vali

Ниче не будет, успокойтесь.

Ответить
Развернуть ветку
4 комментария
Раскрывать всегда