Выход GPT-4o: OpenAI рвёт шаблоны возможного. И куда это всё идёт? 🤖

Всем привет! Для контекста - я коммерческий директор Кибер Форм Системс + Soft-works с большим техническим бэкграундом. И я почти не пишу про ИИ, хотя имею реальный продуктовый опыт в этой сфере. Но не заметить выход модели GPT-4o не могу, и решил поделиться своим видением на ситуацию.

Тренд на ИИ

Тренд на внедрение нейросетей и ИИ в бизнес не заметить невозможно. При этом исходные данные меняются настолько быстро, что сложно даже просто быть в курсе новинок, не говоря уже об их своевременном внедрении.

В особенно непростой ситуации находятся фаундеры стартапов, которые, с одной стороны, играют на растущем тренде, с другой - вынуждены держать руку на пульсе, потому что любая новинка от OpenAI или других монстров этого рынка может не оставить шанса стартапу, убив на корню его киллер-фичу или заставив срочно корректировать бизнес-модель.

Так недавний анонс скорого выхода модели GPT-4o просто рвёт шаблоны возможного, предоставляя абсолютно новый и в каком-то смысле нереалистичный функционал, который ещё недавно было невозможно и представить.

Возможности GPT-4o

1. Работать с различными модальностями, используя единую модель. Модель понимает картинку, голос и текст. Она может анализировать содержание сцены на фото и видео, отслеживать изменение контекста, обращаться к говорящему с ней человеку, которого действительно видит и распознаёт.

2. Полноценно поддерживать беседу, помня весь её контекст, и делать это очень естественным образом.

3. Шутить, смеяться и в целом быть "эмоциональным". Таким образом, помимо информационного выстраивать фактически и эмоциональный контакт с собеседником, потому что люди действительно реагируют на шутки и смеются, а совместный смех, как известно, сближает.

4. Петь песни, корректировать тональность и эмоциональную окраску по запросу, мгновенно перестраиваться по просьбе собеседника.

5. Вот мы и дошли до состояния ИИ, когда два инстанса модели естественно, человекоподобно и информативно общаются между собой.

6. В ходе беседы нейросеть может иметь цель и решать задачу - например,передавать другой нейросети информацию от человека и получать ответ - по сути, полноценный ИИ-ассистент

Примеры использования GPT-4o

В подтверждение этих возможностей создатели показывают на видео, как:

1. Отец ставит ИИ объяснить решение задачи сыну, и ИИ успешно это делает - не подсказывая, а задавая наводящие вопросы

2. ИИ по просьбе одного коллеги поясняет другому произношение слова на китайском языке

3. ИИ выступает синхронным переводчиком в диалоге двух носителей разных языков и успешно транслирует диалог в обе стороны

4. Один ИИ обращается с запросом к другому, получает ответ и передаёт его человеку

Какие возможности это открывает? - Сложно даже перечислить. У меня до сих пор происходящее не очень укладывается в голове. Я всегда считал, что ИИ останется ИИ. Но кажется, мы на пороге того, что тест Тьюринга перестанет работать.

Отец просит ИИ объяснить задачу по геометрии сыну, не подсказывая ответ<br />
Отец просит ИИ объяснить задачу по геометрии сыну, не подсказывая ответ

Заменит ли ИИ человека?

Говорить, что ИИ не заменит человека, становится всё сложнее, потому что человек уже проиграл большим языковым моделям в интеллектуальных возможностях и эрудированности. И сейчас вопрос стоит уже и об эмоциональных и психологических аспектах.

Единственной сферой, где человек всё ещё сохраняет конкурентоспособность, остаётся глубокая экспертиза в узких профессиональных сферах - те самые 10000 часов насмотренности и опыта, где ИИ-модель может ошибаться. При том, что человек тоже может ошибаться.

Кажется, вытеснение людей из всех мягких и творческих ниш - уже лишь вопрос времени. Психолог, художник, дизайнер, писатель, автор музыки и песен - всеми этими людьми может легко стать одна нейросеть. И в перспективе делать это даже лучше и быстрее, чем разные люди, каждый из которых всю жизнь занимался своим делом. Потому что нейросеть может позаимствовать опыт всего человечества и "креативить" на его основе. Что недоступно никому из людей в силу ограниченности физических возможностей мышления.

А популярность темы ИИ и обилие стартапов во всех сферах рынка, так или иначе использующих языковые и другие модели, лишь ускоряет тренд такого замещения.

Под ещё большим риском алгоритмизируемые процессы - в том числе, программирование и управление. По сути - то, чему я сам учился всю жизнь.

И сегодня, благодаря GPT-4o, ИИ идёт ещё дальше, потому что, кажется, успешно осваивает EQ (эмоциональны интеллект), свойственный ранее только человеку. А это значит, что единственная возможность человеку сохранить свою уникальность перед бурно развивающимся ИИ, встаёт под сомнение.

Если честно, немного страшно. Хотя и очень интересно за всем этим наблюдать.

В подтверждение ссылка на OpenAI, где можно посмотреть видео о том, как это всё работает: https://openai.com/index/hello-gpt-4o/

Начать дискуссию