«Умнейший ИИ на Земле»: Grok-3 подтверждает громкие слова Илона Маска
Илон Маск запустил обновленную нейросеть Grok-3, которая по мощностям обошёл o1-pro и немного превосходит DeepSeek-R1 и Gemini 2.0 Flash Thinking.
Что мы знаем о Grok-3:
🔹 Превосходство по результатам бенчмарков
Сказал — сделал, тесты показали отличные результаты. Grok-3 обходит все существующие ИИ-модели, включая GPT-4, Claude 3.5, DeepSeek-V3 и Gemini-2 Pro в таких областях, как математика, программирование и креативные задачи.
🔹 Сложнейшие научные вычисления
Один из самых ярких примеров: Grok-3 за секунды рассчитал окно отправления на Марс и возвращения на Землю — задача, которая в обычных условиях занимает у учёных недели.
🔹 Суперкомпьютер Colossus
Для обучения модели использовался суперкомпьютер Colossus с 200 000 чипами NVIDIA H100, что в 10 раз мощнее, чем для предыдущих версий. Это обеспечивает рекордную скорость и эффективность.
🔹 Deep Research и самообучение
У Grok-3 появилась хайповая функция Deep Research, которая анализирует текстовые данные не только сайтов, но и постов в X*, выявляя контекст и генерируя точные ответы на запросы. Это позволяет искать информацию быстрее, чем аналогичные инструменты у OpenAI.
Также в модели применяется онлайн-обучение: она обучается не только на исторических данных, но и на той информации, которую узнала в процессе работы.
Тем самым нейронка постоянно самоулучшается, с каждым запросом становится умнее и точнее, без необходимости полного переподключения к базам данных и вмешательства со стороны людей.
«Мы сами боимся»
🔹 Режимы Think и Big Brain
Grok-3 обзавёлся двумя мощными режимами: Think, который активирует функцию рассуждений и Big Brain, делающий ИИ гением написания кода и решения математических задач.
🔹 Реальные игры и алгоритмы в реальном времени
Grok-3 способен не только отвечать на вопросы, но и создавать рабочие прототипы игр в реальном времени. Например, в одном из стримов была продемонстрирована созданная в режиме реального времени версия тетриса с механиками «три в ряд», где использовались алгоритмы симуляции и генеративные модели для создания игрового процесса.
Где протестировать Grok-3?
На данный момент Grok-3 доступен для пользователей Premium+ X*, но тестирование открыто на LmArena в разделе «Direct Chat» через модель early-grok-3.
Что ждём в будущем?
Планируют добавить голосовой режим, выложить исходный код Grok-2, усовершенствовать режим Big Brain и написать API под Grok-3, чтобы другие разработчики могли интегрировать нейронку в свои проекты.
* X заблокирован на территории РФ.
Хотите увеличить популярность ваших публикаций во ВКонтакте? В этом может помочь бесплатная накрутка лайков. Лайки не только привлекают внимание, но и укрепляют доверие к вашему контенту, расширяя аудиторию. Как выбрать подходящий сервис для этой задачи?
Расскажу заодно и о Grok3: что это за ИИ модель, ради которой пользователям придется платить немаленькие деньги.
На днях был представлен Grok-3 – новая ИИ-модель от Илона Маска, которая уже успела взбудоражить сообщество. Это самая мощная версия среди разработок xAI, которая обходит GPT-4, Gemini и другие модели по бенчмаркам.
модель иногда «пугающе умна», предлагая неожиданные решения, о которых пользователи даже не задумывались.
Хочу поделиться с вами своим отрицательным опытом в бизнесе. Рассказать про ошибки, которые мы совершили с мужем, когда открывали кондитерский отдел: как мы подходили к запуску бизнеса, выбору помещения и о других нюансах работы в этой нише.
Илон Маск и его команда из xAI только что (18 февраля) представили новую версию своего ИИ-помощника, Grok 3. Многие ждали! Так что же там показали – действительно прорыв или планомерное улучшение?
Компания xAI Илона Маска представила новую версию своего чат-бота Grok-3, который уже завоевал лидерство в рейтингах среди ИИ-моделей. В слепых тестах на платформе Chatbot Arena он обошёл ChatGPT, Gemini и DeepSeek, продемонстрировав выдающиеся результаты в программировании, математике и обработке сложных запросов.
Звучит мощно, но как всегда вопрос, насколько это всё применимо в реальных задачах? Бенчмарки это одно, а вот стабильная работа и полезность в повседневных задачах – совсем другое. DeepSearch и Big Brain выглядят интересно, но пока непонятно, насколько они реально круче того же GPT-4. Надо дождаться API, тогда можно будет тестить в боевых условиях
Маск сказал, маску нужно верить! Маск не врёт!
Если кратко 6 месяцев тому назад ни один генеративный ИИ не мог правильно поределить тональность сложного текста по отношению к объекту. Покупать API смысла не было.
Я не эксперт, но сейчас все мои сложные тексты что Яндекс GPT что Дипсик определяют верно. Я впечатлен прогрессом!
Я тут порешал с Дипсик задачку "Трёхзначные числа a и b таковы, что a = 2b и все шесть цифр, входящие в эти два
числа, различны. Какое наибольшее значение может принимать число b?"
Если кратко - еще слабоваты их "глубокие рассуждения". Дипск по непонятной причине заявил что в паре чисел
486 и 972 есть повторяющиеся цифры. А Яндекс не перебирал числа а сразу выдал ответ, сказав "я оптимизировал перебор", то есть он был обучен на каком-то сокращеном решении и знал решение а не алгоритм рассуждений.
за 30$ пшел он нафик