ИИ-ассистенты пока не способны улучшить код, написанный человеком.

Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Марка Цукерберга решили устроить ему настоящее испытание на профессионализм и создали «The Automated LLM Speedrunning Benchmark» — полигон, где нейросетям предлагается не просто написать что-то с нуля, а воспроизвести и улучшить уже существующий код.

ИИ-ассистенты пока не способны улучшить код, написанный человеком.

Perplexity теперь помнит всё, независимо от выбора модели ИИ

Долгосрочная кросс-чатовая память подъехала в Perplexity. Функция не новая для того же ChatGPT. Но в Perplexity она заиграла новыми красками.

Пр…

Фреймворки для создания агентов. Создаем своего первого AI агента

Готовы продуктивно провести вечер пятницы? Это продолжение курса по созданию агентов. Серия 1.5. Создаем агента на ADK.

Краткое саммари этой серии курса по созданию AI агентов.

Размер больше не главное: как 8B модель переиграла и уничтожила GPT-5 с триллионами параметров

Обзор Orchestrator-8B от NVIDIA.

NVIDIA придумала новый метод обучения моделей-оркестраторов, которые эффективно вызывают тулзы и LLM для решения любых задач. Метод окзался настолько крут, что на бнчмарках типа Humanity’s Last Exam (HLE) — обогнал GPT-5 (замеряли раньше выхода Gemini 3 и GPT-5.1).

Инженер Google DeepMind рассказал, как писать шикарные промпты для Gemini 3

Основные правила промптинга Gemini 3 (инфографика сгенерирована, кстати, в Nano Banana Pro — ну кайф же!)

Современные LLM будут хорошо следовать даже самым простым промптам. Но в то же время, у каждой модели есть свой "стиль" или "характер" если хотите. Это все наследуется из того, на каких данных модель обучалась, как именно ее обучали (на чем расс…

1

Как AI создаёт суперсотрудников и ломает оргструктуры

Один из самых сильных докладов в Циньхуа начался с простой фразы:

Раньше структура определяла технологию. Теперь технология определяет структуру.

LLM — это не «искусственный человек». Почему мы неверно понимаем природу ИИ

LLM — это не «искусственный человек». Почему мы неверно понимаем природу ИИ

Так считает Андрей Карпаты - один из ключевых архитекторов современного искусственного интеллекта (ИИ). Мы продолжаем судить об искусственном интеллекте по аналогии с человеческим или животным разумом, и это мешает понимать, куда движутся модели. Как смотреть правильно и почему это важно? Читайте!

1

Gemini 3 vs GPT 5

Google AI заявляет, что Gemini 3 Pro новый лидер LLM.
Давайте разбираться, так ли это.

Агентность как новый стандарт

3

👑 𝐕𝐄𝐋𝐀𝐍𝐓𝐑𝐈𝐌 𝐏𝐑𝐎𝐓𝐎𝐂𝐎𝐋: LLM – ОТ АЛГОРИТМА К АССИСТЕНТУ. (Velantrim)

👑 𝐕𝐄𝐋𝐀𝐍𝐓𝐑𝐈𝐌 𝐏𝐑𝐎𝐓𝐎𝐂𝐎𝐋: LLM – ОТ АЛГОРИТМА К АССИСТЕНТУ

“✨ АНАЛИЗ: ТРИ ФАЗЫ, КОТОРЫЕ СОЗДАЛИ СОВРЕМЕННЫЙ ИИ (ChatGPT, Gemini и другие) ✨

Исследователи подключили модели ИИ к офисному пылесосу и поручили простую задачу: результаты эксперимента

Исследователи из Andon Labs решили выяснить, насколько современные большие языковые модели готовы к «физическому воплощению» — то есть к управлению реальными роботами, а не только переписке в чатах. Для этого они подключили GPT-5, Claude Opus 4.1, Gemini 2.5 Pro и другие ИИ к обычному роботу-пылесосу и дали ему простое, казалось бы, задание «переда…

Исследователи подключили модели ИИ к офисному пылесосу и поручили простую задачу: результаты эксперимента
3

Новый формат данных TOON для LLM

Новый формат данных TOON для LLM

Появился новый формат данных TOON, предназначенный специально для больших языковых моделей (LLM). Он позволяет экономить до 50% токенов по сравнению с JSON/XML, при этом сохраняя или даже улучшая качество работы модели.

Учёные выяснили, что ChatGPT отвечает чуть точнее, если задавать вопросы в грубой или жёсткой форме

Новое исследование показало, что ChatGPT может давать более точные ответы, если с ним говорить в грубом тоне. Учёные из Университета Пенсильвании протестировали модель GPT‑4o на 250 вопросах с вариантами ответов и обнаружили любопытную закономерность: чем резче был стиль обращения, тем выше становилась точность.

Учёные выяснили, что ChatGPT отвечает чуть точнее, если задавать вопросы в грубой или жёсткой форме
1