GPT-будущее. Часть 1. AGI
Два года назад я написал статью “GPT-3. Есть проблема больше, чем потеря рабочих мест”. Это были системные прогнозы относительно изменений в обществе. Часть прогнозов сбылись. К другим мы движемся. Я решил обновить и расширить своё видение будущего.
Для интерпретации прогнозов важно понимать личность автора. Коротко обо мне - автор книги “Просто о мозге”, IT-предприниматель и основатель Сказбуки, eх. руководитель Edutainment направления в Яндекс, автор системы раннего развития “Комплементарный интеллект”.
Последние 20 лет я изучаю алгоритм мышления. У меня макро-философский уровень интереса. Мне интересно как зародилось мышление задолго до появления человека, и куда оно эволюционирует в пост-человеческую эпоху. Поэтому неудивительно, что последние годы я пристально слежу за ИИ через эту призму.
Моя теоретическая основа - я изучаю научные, технические и философские материалы, связанные с искусственным и естественным интеллектом. Читаю классическую и современную философию. Слежу за новостями в области ИИ и робототехники. В рамках моих интересов: когнитивные науки, социальная инженерия, а так же профессии, которые так или иначе скрыто изучали алгоритмы мышления: маркетинг, сценаристика, политика, гейм-дизайн.
Моя практическая основа - пол года назад я создал компанию, которая полностью состоит из ИИ-сотрудников. Подробнее об этом кейсе писал App2Top и Forbes. Моя компания разрабатывает игру Beat Brush - симулятор художника, который слышит музыку когда рисует.
Эта серия статей - моё представление относительно развития общества. Я расскажу о том, что многие риски преувеличены. Например, что ИИ вырвется на свободу и поработит человечество. Однако, нас всё равно ждёт один из самых больших кризисов в истории.
Я предположу как изменится: работа, образование, политика, культура, наука и социум. И что, исходя из этих изменений, нужно прямо сейчас делать. Так же я постараюсь максимально обогатить текст источниками.
Контекст
Вначале нужно задать немного контекста, просто несколько новостей из мира, в котором мы находимся прямо сейчас:
- Первый в мире ИИ-министр назначен в Албании. Отвечает за все государственные закупки. Не консультирует, а именно принимает решения.
- В США запущено 5 сервисов беспилотного такси, самый крупный Waymo One. Подростки выбирают именно этот тип такси, так как считают его безопаснее.
- ИИ уже фиксируется как самостоятельная причина десятков тысяч увольнений, и этот показатель быстро растёт.
- Человекоподобные роботы уже более ловкие и быстрые, чем человек. Просто посмотрите это видео.
- Гарвард объявил о первом ИИ-преподавателе.
- Джеймс Кэмерон вошёл в совет директоров Stability AI (генеративный ИИ).
- Новые неорганические материалы, новый класс антибиотиков, структуры белков в промышленных масштабах - это всё научные открытия сделанные с помощью ИИ. Раньше на них уходили десятилетия, теперь часы.
- Masters of Prophecy - самый быстрорастущий ютуб-канал на платформе (вырос с сотен подписчиков до десятков миллионов за несколько месяцев) полностью состоит из ИИ контента.
- В ICPC World Finals (кодинг-олимпиада) ChatGPT решил 12 из 12 задач и занял первое место по балам. В IMO 2025 (Международная математическая олимпиада) ChatGPT решил 5 из 6 задач.
- ChatGPT — самый быстрорастущий сервис в истории (достиг 100 миллионов ежемесячных пользователей за 2 месяца после запуска). А на данный момент (по мнению Google) языковыми моделями пользуется больше 2 миллиардов человек. Просто вдумайтесь в эту цифру.
Этот контекст нужен, чтобы было чуть легче воспринять то, что буду говорить дальше. И это всё не будущее - это прошлое. К моменту, как вы читаете эту статью мир шагнул дальше, и сделал это ещё быстрее.
AGI
Золотой грааль ИИ - это AGI (Artificial general intelligence) сильный искусственный интеллект универсального назначения. Проще говоря, не хуже человеческого. Вот только это просто пыль в глаза. Философская концепция и маркетинговая уловка.
Потому что такого интеллекта и у самого человека не существует. У человека весьма ограниченный набор скилов, в зависимости от обучения. Отправьте дворника строить ракету и посмотрите как этот чудо-интеллект будет решать задачу.
К тому же, мозг человека - это комплекс разных систем. Несколько крупных отделов, а внутри этих отделов сотни подсистем. Синергия разных систем и создаёт волшебство человеческого мышления.
А знаете как сейчас работает ChatGPT? Да точно так же. Там внутри не одна ИИ-модель, которая отвечает за всё, а комплекс разных моделей, которые подключаются в зависимости от задачи.
Нейросети проходят тот же эволюционный путь, что проходил наш мозг. Несколько крупных отделов и множество маленьких подсистем. У подсистем может быть разная архитектура, а может просто иной датасет. В мозге такой же принцип.
Это значит, что мы уже обладаем AGI. И секрет его не в том как построить одну гигамодель, а в том, как правильно комбинировать и обучать нейросети под задачу. И для множества задач они уже обучены и скомбинированы так, что превосходят человека.
Вопрос времени, когда будут закрыты все способности, которые приписывают людям. Уже не требуется какой-то фазовый технологический переход, просто последовательный перебор задач и понятные инженерные решения.
Именно поэтому GPT-5 никого особо не шокировал. Не стал каким-то новым вау-моментом. Это не качественное изменение, а количественное. Там внутри просто больший пласт комбинаций под разные задачи. OpenAI расширяет зону, где комбинации дают максимальный результ. А заодно оптимизирует затраты энергии под такое ошеломительное количество пользователей.
Человеческий мозг в текущем виде существовал уже 30 тысяч лет назад. Современная цивилизация появилась благодаря тому, что мы всё лучше находили точки его применения.
С искусственным интеллектом всё происходит так же. OpenAI использовала технологию, которой десятки лет. Да, она была доработана и усилена вычислительными мощностями. Но никаких фундаментальных открытий не было. Это инженерное, а не научное достижение.
Как итог - AGI не появится как какое-то грандиозное событие. Просто потому что он уже здесь.
Ограниченность ИИ
Есть одна интересная идея вокруг ИИ - так как он был обучен на данных, созданных человеком, всё что он придумывает будет вторичным.
Если попросить генератор картинок нарисовать иллюстрацию, то он будет опираться на иллюстрации, которые легки в основу его обучения. Следовательно, в отличии от человека, никогда не сможет придумать что-то принципиально новое.
Это гипотез звучит разумно, но есть несколько “но”.
Для начала, стоит подчеркнуть, что человеческий мозг работает точно так же. Нейросеть художника обучается на данных, которые поступают от разных органов чувств, а затем находит взаимосвязи.
Ключевое отличие текущих генераторов от живого человека - это мультимодальность данных. Проще говоря, у художника может собраться в единое впечатление: закат, ощущение ветра на коже, и музыка играющая в наушниках. Это впечатление он и запечатлит на картине.
Популярные нейросети пока устроены иначе - датасет достаточно однородный. Генераторы картинок учат на фотографиях и иллюстрациях. Музыкальные генераторы учат на музыке. Генераторы структуры белков на известных структурах.
Но это если мы говорим только о популярных нейросетях. Потому что прямо сейчас для обучения новых нейросетей используется мультимодальный подход.
Во-первых, инженеры уже придумали как обучать нейросети на разном типе данных. Во-вторых, и это самое интересное, нейросети начинают выпускать в реальный мир.
В самом примитивном виде это выглядит так - берут робота, обвешивают его всеми возможными датчиками фиксации окружения и отправляют гулять по офлайновому миру. Такой “детектор” видит, чувствует и слышит реальность. И делает это на недостижимом для человека уровне. Для модели, которая будет построена на таком принципе, окружающий мир перестаёт быть фрагментарным. Мир становится целым. Этот подход так и называют - построение модели мира.
Но можно пойти ещё дальше. Можно создать виртуальный мир, заполонить его миллионами таких детекторов и получить ещё больше мультимодальных данных. А благодаря играм, мы отлично научились создавать виртуальные миры. Именно такой подход сейчас развивает Nvidia.
Если объединить всё вышесказанное, то можно утверждать, что прямо сейчас мы видим переход от “пережевывания опыта, созданного человеком” к получения своего собственного личного опыта мира.
Это значит, что ИИ сможет создавать новые художественные стили, придумывать уникальные сюжетные повороты, и делать полноценный научные открытия. И это не будущее, мы уже здесь.
В следующей части мы поговорим о том, почему ИИ полноценно сможет заменить человека в области искусства и творчества. Не только повторять существующие творческие ходы, но и создавать новые.
Если вам интересно прочитать следующую часть быстрее, то можете это сделать у меня в телеграм канале.