ИИ-ассистенты пока не способны улучшить код, написанный человеком.

Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Марка Цукерберга решили устроить ему настоящее испытание на профессионализм и создали «The Automated LLM Speedrunning Benchmark» — полигон, где нейросетям предлагается не просто написать что-то с нуля, а воспроизвести и улучшить уже существующий код.

ИИ-ассистенты пока не способны улучшить код, написанный человеком.

«Бот за 5 минут» против взрослого AI-агента: как бизнесу не перепутать игрушку с инфраструктурой

«Бот за 5 минут» против взрослого AI-агента: как бизнесу не перепутать игрушку с инфраструктурой

Сегодня почти каждый сервис обещает: «Мы подключим вам ИИ-агента за вечер».

Лидеры среди ИИ моделей

Компания OpenRouter (крупная платформа, которая анализирует миллиарды запросов к ИИ-моделям по всему миру), выпустила отчет State of AI. Это одна из немногих возможностей посмотреть не что говорят об ИИ, а что люди реально делают с ИИ.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fopenrouter.ai%2Fstate-of-ai&postId=2636053" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
1

Как на самом деле используются ИИ-модели в мире?

Появилась редкая возможность посмотреть не что говорят об ИИ, а что люди реально делают с ИИ. Расскажу об основных выводах из отчета State of AI, который выпустила компания OpenRouter (крупная платформа, которая анализирует миллиарды запросов к ИИ-моделям по всему миру).

Программирование – доминирующая и растущая категория. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fopenrouter.ai%2Fstate-of-ai&postId=2635612" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
8

The state of enterprise AI: что узнали в OpenAI про 1 миллион своих корпоративных клиентов

The state of enterprise AI: что узнали в OpenAI про 1 миллион своих корпоративных клиентов

OpenAI опубликовал новый отчет об использовании их моделей в Enterprise секторе. Он основан на:

Perplexity теперь помнит всё, независимо от выбора модели ИИ

Долгосрочная кросс-чатовая память подъехала в Perplexity. Функция не новая для того же ChatGPT. Но в Perplexity она заиграла новыми красками.

Пр…

Фреймворки для создания агентов. Создаем своего первого AI агента

Готовы продуктивно провести вечер пятницы? Это продолжение курса по созданию агентов. Серия 1.5. Создаем агента на ADK.

Краткое саммари этой серии курса по созданию AI агентов.

Размер больше не главное: как 8B модель переиграла и уничтожила GPT-5 с триллионами параметров

Обзор Orchestrator-8B от NVIDIA.

NVIDIA придумала новый метод обучения моделей-оркестраторов, которые эффективно вызывают тулзы и LLM для решения любых задач. Метод окзался настолько крут, что на бнчмарках типа Humanity’s Last Exam (HLE) — обогнал GPT-5 (замеряли раньше выхода Gemini 3 и GPT-5.1).

Инженер Google DeepMind рассказал, как писать шикарные промпты для Gemini 3

Основные правила промптинга Gemini 3 (инфографика сгенерирована, кстати, в Nano Banana Pro — ну кайф же!)

Современные LLM будут хорошо следовать даже самым простым промптам. Но в то же время, у каждой модели есть свой "стиль" или "характер" если хотите. Это все наследуется из того, на каких данных модель обучалась, как именно ее обучали (на чем расс…

1

Как AI создаёт суперсотрудников и ломает оргструктуры

Один из самых сильных докладов в Циньхуа начался с простой фразы:

Раньше структура определяла технологию. Теперь технология определяет структуру.

LLM — это не «искусственный человек». Почему мы неверно понимаем природу ИИ

LLM — это не «искусственный человек». Почему мы неверно понимаем природу ИИ

Так считает Андрей Карпаты - один из ключевых архитекторов современного искусственного интеллекта (ИИ). Мы продолжаем судить об искусственном интеллекте по аналогии с человеческим или животным разумом, и это мешает понимать, куда движутся модели. Как смотреть правильно и почему это важно? Читайте!

1

Gemini 3 vs GPT 5

Google AI заявляет, что Gemini 3 Pro новый лидер LLM.
Давайте разбираться, так ли это.

Агентность как новый стандарт

3