OpenAI представляет «Project Strawberry»

OpenAI представляет «Project Strawberry»

OpenAI снова расширяет границы искусственного интеллекта, представляя новую ИИ-модель под названием «Project Strawberry», о которой пока не сообщалось. Эта инициатива, ранее известная как Q*, направлена на значительное расширение возможностей ИИ-моделей в области мышления.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Suno, Редактор с 12 различными ИИ-инструментами для ретуши фото.


☝️Это только часть функций, доступных в SYNTX!

Согласно недавним утечкам от Bloomberg и Reuters, OpenAI добивается прогресса в создании ИИ-моделей, способных планировать, автономно ориентироваться в интернете и проводить то, что OpenAI называет «глубокими исследованиями».

Во вторник на внутреннем совещании OpenAI показала демо-версию исследовательского проекта, который, по ее словам, обладает новыми способностями к рассуждению, подобными человеческим, сообщает Bloomberg.

По сути, OpenAI стремится сделать ИИ более похожим на человека.

По некоторым данным, OpenAI провела внутреннее тестирование модели, показав 90-процентный результат в сложном математическом тесте для ИИ. Однако они не смогли подтвердить, связано ли это с Project Strawberry.В то же время два других источника сообщили, что видели демонстрационные ролики проекта Q*, в которых модели решают сложные математические и научные вопросы, выходящие за рамки возможностей современных ведущих коммерческих ИИ.

Какие именно методы использовал OpenAI для расширения этих возможностей, пока неясно. В отчете Reuters упоминается, что проект Strawberry включает в себя тонкую настройку существующих больших языковых моделей OpenAI, которые уже были обучены на обширных наборах данных.

Этот подход, как сообщается, схож с тем, который описывается в работе 2022 года исследователей из Стэнфорда под названием Self-Taught Reasoner (STaR).

OpenAI представляет «Project Strawberry»

На рисунке выше внешний цикл тонкой настройки обозначен пунктирной линией. Предполагается, что вопросы и истинные ответы присутствуют в наборе данных, а обоснования генерируются с помощью STaR.

Так что же происходит с Strawberry?

Несколько недель назад в интервью Dartmouth Engineering технический директор OpenAI Мира Мурати рассказала о следующем поколении ИИ, который, по ее словам, будет обладать интеллектом, сравнимым с интеллектом человека с докторской степенью.

OpenAI представляет «Project Strawberry»

Strawberry - это та модель, о которой она говорит?

«Самые важные области прогресса будут связаны с умением рассуждать». - Сэм Альтман, генеральный директор OpenAI

Современные ИИ-модели отлично справляются с генерацией текста и выполнением конкретных задач, но им трудно даются сложные рассуждения, долгосрочное планирование и автономное принятие решений.
Однако важно учитывать более широкий контекст.
Поскольку Илья Суцкевер больше не является частью OpenAI, а ключевые члены команды согласования покинули компанию, растут опасения по поводу направления исследований OpenAI и безопасности продуктов, которые они выпускают на рынок.
Хотя я глубоко скептически отношусь к нынешней траектории развития, я не являюсь экспертом в области ИИ. Мои опасения связаны с быстрыми темпами развития и потенциальными последствиями этих передовых технологий.

Ранее известный как Q* (Q-Star)

Проект Q* получил широкую известность в 2023 году из-за драмы с Сэмом Альтманом и Ильей Суцкевером; на самом деле разработка велась с начала 2022 года.

OpenAI представляет «Project Strawberry»

Основные сроки разработки:

  • Начало 2022 года: OpenAI начинает работу над тем, чтобы сделать свои ИИ-системы более умными в рассуждениях.
  • Середина 2022 года: Илья Суцкевер, выдающийся исследователь OpenAI, начинает реализацию проекта Q*.
  • Конец 2022 года: Команда Q* получает модель для решения простых математических задач
  • Начало 2023 года: Возникает конфликт между исследователями Q* и генеральным директором Сэмом Альтманом по поводу проекта

Архитектура Project Q* сочетает в себе большие языковые модели, обучение с подкреплением и поисковые алгоритмы. Она объединяет методы глубокого обучения, использованные в ChatGPT, с правилами, запрограммированными человеком. Эта ИИ-модель потенциально сочетает в себе Q-обучение и поиск A*.

Почему она называется Q*?

Официального заявления от OpenAI нет, но термин «Q*» может быть связан с историей DeepMind, связанной с обучением с подкреплением. Изначально DeepMind использовала Q-обучение для обучения нейронной сети для игры в видеоигры Atari путем проб и ошибок, оптимизируя функцию, называемую Q-функцией, для оценки вознаграждения за различные действия.

Опираясь на эту основу, Q*, вероятно, представляет собой попытку объединить большие языковые модели с методами поиска в стиле AlphaGo, потенциально используя обучение с подкреплением для улучшения модели. Целью является создание системы, в которой языковые модели могут совершенствовать свои способности, «играя против самих себя» в сложных задачах рассуждения, расширяя границы возможностей этих моделей.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Хотя мы еще не знаем всех деталей, ясно, что они нацелены на что-то большое. Я скептически отношусь к тому, что Q*, или проект «Клубника», - это прорыв, который приведет к AGI. Я не верю, что он представляет угрозу для человечества. Однако он может стать значительным шагом на пути к созданию ИИ с общими способностями к рассуждению.

Важно понимать, что интеллект, будь то человеческий или искусственный, существует в различных диапазонах.

Как способность человека к рассуждению зависит от таких факторов, как IQ, так и ИИ-системы также имеют различные уровни возможностей в зависимости от их дизайна и обучения. Для многих промышленных и специализированных приложений современные ИИ-системы уже демонстрируют AGI-подобные способности, превосходя большинство людей в специфических задачах, связанных с анализом данных, распознаванием образов и логическими рассуждениями.

Однако человек по-прежнему сохраняет преимущество в таких областях, как общее мышление, здравый смысл, креативность и эмоциональный интеллект. Ключ к раскрытию действительно преобразующего потенциала лежит не в противопоставлении ИИ и человеческого интеллекта, а в их объединении.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Suno, Редактор с 12 различными ИИ-инструментами для ретуши фото.


☝️Это только часть функций, доступных в SYNTX!

Источник статьи на английском - здесь

1111
9 комментариев

вообще не понимают что творят, нужно принимать срочные ограничения

1

Как так получилось, что Вы не в наблюдательном совете openai?

2

Да, судя по всему, все ограничения с них сняли )

Красава, быстрей бы общий ИИ, а потом роботов совместили с ИИ)

1

К этому идет, судя по всему )

быстрей бы? Вы что самоубийца, зачем вам это?)