Выход GPT-4o: OpenAI рвёт шаблоны возможного. И куда это всё идёт? 🤖

Всем привет! Для контекста - я коммерческий директор Кибер Форм Системс + Soft-works с большим техническим бэкграундом. И я почти не пишу про ИИ, хотя имею реальный продуктовый опыт в этой сфере. Но не заметить выход модели GPT-4o не могу, и решил поделиться своим видением на ситуацию.

Тренд на ИИ

Тренд на внедрение нейросетей и ИИ в бизнес не заметить невозможно. При этом исходные данные меняются настолько быстро, что сложно даже просто быть в курсе новинок, не говоря уже об их своевременном внедрении.

В особенно непростой ситуации находятся фаундеры стартапов, которые, с одной стороны, играют на растущем тренде, с другой - вынуждены держать руку на пульсе, потому что любая новинка от OpenAI или других монстров этого рынка может не оставить шанса стартапу, убив на корню его киллер-фичу или заставив срочно корректировать бизнес-модель.

Так недавний анонс скорого выхода модели GPT-4o просто рвёт шаблоны возможного, предоставляя абсолютно новый и в каком-то смысле нереалистичный функционал, который ещё недавно было невозможно и представить.

Возможности GPT-4o

1. Работать с различными модальностями, используя единую модель. Модель понимает картинку, голос и текст. Она может анализировать содержание сцены на фото и видео, отслеживать изменение контекста, обращаться к говорящему с ней человеку, которого действительно видит и распознаёт.

2. Полноценно поддерживать беседу, помня весь её контекст, и делать это очень естественным образом.

3. Шутить, смеяться и в целом быть "эмоциональным". Таким образом, помимо информационного выстраивать фактически и эмоциональный контакт с собеседником, потому что люди действительно реагируют на шутки и смеются, а совместный смех, как известно, сближает.

4. Петь песни, корректировать тональность и эмоциональную окраску по запросу, мгновенно перестраиваться по просьбе собеседника.

5. Вот мы и дошли до состояния ИИ, когда два инстанса модели естественно, человекоподобно и информативно общаются между собой.

6. В ходе беседы нейросеть может иметь цель и решать задачу - например,передавать другой нейросети информацию от человека и получать ответ - по сути, полноценный ИИ-ассистент

Примеры использования GPT-4o

В подтверждение этих возможностей создатели показывают на видео, как:

1. Отец ставит ИИ объяснить решение задачи сыну, и ИИ успешно это делает - не подсказывая, а задавая наводящие вопросы

2. ИИ по просьбе одного коллеги поясняет другому произношение слова на китайском языке

3. ИИ выступает синхронным переводчиком в диалоге двух носителей разных языков и успешно транслирует диалог в обе стороны

4. Один ИИ обращается с запросом к другому, получает ответ и передаёт его человеку

Какие возможности это открывает? - Сложно даже перечислить. У меня до сих пор происходящее не очень укладывается в голове. Я всегда считал, что ИИ останется ИИ. Но кажется, мы на пороге того, что тест Тьюринга перестанет работать.

Отец просит ИИ объяснить задачу по геометрии сыну, не подсказывая ответ<br />

Заменит ли ИИ человека?

Говорить, что ИИ не заменит человека, становится всё сложнее, потому что человек уже проиграл большим языковым моделям в интеллектуальных возможностях и эрудированности. И сейчас вопрос стоит уже и об эмоциональных и психологических аспектах.

Единственной сферой, где человек всё ещё сохраняет конкурентоспособность, остаётся глубокая экспертиза в узких профессиональных сферах - те самые 10000 часов насмотренности и опыта, где ИИ-модель может ошибаться. При том, что человек тоже может ошибаться.

Кажется, вытеснение людей из всех мягких и творческих ниш - уже лишь вопрос времени. Психолог, художник, дизайнер, писатель, автор музыки и песен - всеми этими людьми может легко стать одна нейросеть. И в перспективе делать это даже лучше и быстрее, чем разные люди, каждый из которых всю жизнь занимался своим делом. Потому что нейросеть может позаимствовать опыт всего человечества и "креативить" на его основе. Что недоступно никому из людей в силу ограниченности физических возможностей мышления.

А популярность темы ИИ и обилие стартапов во всех сферах рынка, так или иначе использующих языковые и другие модели, лишь ускоряет тренд такого замещения.

Под ещё большим риском алгоритмизируемые процессы - в том числе, программирование и управление. По сути - то, чему я сам учился всю жизнь.

И сегодня, благодаря GPT-4o, ИИ идёт ещё дальше, потому что, кажется, успешно осваивает EQ (эмоциональны интеллект), свойственный ранее только человеку. А это значит, что единственная возможность человеку сохранить свою уникальность перед бурно развивающимся ИИ, встаёт под сомнение.

Если честно, немного страшно. Хотя и очень интересно за всем этим наблюдать.

В подтверждение ссылка на OpenAI, где можно посмотреть видео о том, как это всё работает: https://openai.com/index/hello-gpt-4o/