Создатель AlphaGo поднял миллиард на одной ставке

Создатель AlphaGo поднял миллиард на одной ставке

DeepMind — это AI-лаборатория Google. Та самая, которая в 2016 году сделала систему AlphaGo, обыгравшую чемпиона мира по го Ли Седоля. Для ИИ это был момент уровня, когда машина впервые публично сделала то, что ещё вчера мог только живой человек.

Потом DeepMind выкатила AlphaZero — более общий подход для игр с понятными правилами. Ей давали правила шахмат, го или сёги, а дальше она училась сама, играя миллионы партий против себя.

В шахматах AlphaZero через несколько часов обыграла Stockfish — движок, в который десятилетиями зашивали человеческую шахматную мудрость. Без необходимости проводить базы партий гроссмейстеров и изучать учебники. Система описалась на простые правила, игру против себя и отбор работающих ходов.

Играла она тоже не как аккуратный отличник. Странно жертвовала фигуры, ломала привычки, которые прививают учебники, находила ходы, которые люди потом ещё долго разбирали как новые идеи.

Это важнее, чем очередная история о том, как ИИ обыграл человека. GPT учится на человеческих текстах и продолжает то, что уже писали люди.

AlphaZero училась через собственный опыт.

Дэвид Сильвер, главный архитектор AlphaGo и AlphaZero, теперь строит вокруг этого новую компанию — Ineffable Intelligence. Вместе с Ричем Саттоном он уже описывал эту линию в Welcome to the Era of Experience:

Следующий скачок ИИ придёт из систем, которые умеют действовать, ошибаться, получать последствия и учиться на этом

На прошлой неделе Ineffable вышла из тени и сразу подняла 1,1 млрд долларов при оценке 5,1 млрд. В раунде — Sequoia, Lightspeed, Nvidia, Google и другие взрослые ребята.

У стартапа пока нет продукта, выручки и подробной демки. Но есть команда и ставка: на то, что LLM-эпоха упёрлась в человеческий интернет, а дальше капитал пойдёт в модели, которые добывают опыт сами.

Это следующая большая смена парадигмы в ИИ. Тексты больше не выглядят главным топливом ИИ; теперь этим становится среда, действие, ошибка, награда и новая попытка. Проблема только в том, что реальный мир не шахматная доска. Тут правил меньше, а шума больше, и победу часто невозможно формально посчитать.⠀

Название у компании идеальное, Ineffable («невыразимое»). Хорошее имя для стартапа, который хочет научить ИИ всему, что люди не смогли выразить словами.

⠀—

Подпишись на Telegram-канал: @human20

2
Начать дискуссию