ИИ-ассистенты пока не способны улучшить код, написанный человеком.

Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Марка Цукерберга решили устроить ему настоящее испытание на профессионализм и создали «The Automated LLM Speedrunning Benchmark» — полигон, где нейросетям предлагается не просто написать что-то с нуля, а воспроизвести и улучшить уже существующий код.

ИИ-ассистенты пока не способны улучшить код, написанный человеком.

DeepSeek Engram: условная память LLM через поиск.

DeepSeek опять шатают устои архитектуры трансформеров свежайшим пейпером , который доказывает, что новое — это хорошо и очень хитро забытое старое.

3

На кого похожи языковые модели

Разработчики пытаются делать так, чтобы языковые модели вели себя как люди. Но люди-то все разные, так под кого они подстраиваются?

Мы тут время от времени поднимаем эту тему и уже говорили, например, о том, что «среднестатистический человек» в тренировочных данных для ИИ – это человек какой-нибудь богатой западной демократии, просто потому ч…

Spec-driven development: воспроизведение проекта только по спецификациям

Spec-driven development: воспроизведение проекта только по спецификациям

Может ли AI клонировать проект по спецификациям?

LLM ошибаются, потому что отвечают слишком рано

Знакомая ситуация: вы задаете вопрос ИИ, получаете быстрый и уверенный ответ. Но не совсем о том: формально он выглядит правильно, но по сути – нет. Кажется, нашли проблему (а значит, решение). Как это обнаружили, почему так происходит , а главное – что с этим делать на практике?

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Farxiv.org%2Fpdf%2F2512.21120&postId=2675819" rel="nofollow noreferrer noopener" target="_blank">Источник</a> 
3

Отчёт о состоянии ИИ по итогу 2025 года

Этот отчёт - это эмпирическое исследование реального использования LLM, основанное на анализе 100 триллионов токенов запросов, прошедших через платформу OpenRouter за ~2 года (фокус на 2024–2025).

Важно:

1

🍅Учёные "посадили" ChatGPT, Grok и Gemini на кушетку психотерапевта - и внезапно нашли у них "внутренний конфликт".

🍅Учёные "посадили" ChatGPT, Grok и Gemini на кушетку психотерапевта - и внезапно нашли у них "внутренний конфликт".

Вышла статья When AI Takes the Couch (arXiv:2512.04124v1). Идея простая и слегка криповая: не тестировать LLM как инструмент, а вести с ней терапевтические "сессии", а потом прогнать через психометрию.

4

С чего начать работу с ИИ: объяснение на пальцах и простые инструкции

Если вы пока смутно понимаете, что такое ИИ, но чувствуете, что уже пора начать им пользоваться, вот вам знак! Андрей Карпати (экс-OpenAI, Tesla), один из самых лучших популяризаторов ИИ, показывает, как работают современные LLM и как они реально полезны, в работе и повседневной жизни. Перескажу ключевые идеи его выступления, чтобы дальше в теме бы…

С чего начать работу с ИИ: объяснение на пальцах и простые инструкции
1

Прогнозы на 2025–2029 про искусственный интеллект: что будет с работой и профессиями

Прогнозы Gartner: что будет с компаниями к 2026–2029 из-за ИИ (менеджмент, персонал, безопасность)

1) ИИ «уплощит» оргструктуры и ударит по среднему менеджменту

«Бот за 5 минут» против взрослого AI-агента: как бизнесу не перепутать игрушку с инфраструктурой

«Бот за 5 минут» против взрослого AI-агента: как бизнесу не перепутать игрушку с инфраструктурой

Сегодня почти каждый сервис обещает: «Мы подключим вам ИИ-агента за вечер».

Лидеры среди ИИ моделей

Компания OpenRouter (крупная платформа, которая анализирует миллиарды запросов к ИИ-моделям по всему миру), выпустила отчет State of AI. Это одна из немногих возможностей посмотреть не что говорят об ИИ, а что люди реально делают с ИИ.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fopenrouter.ai%2Fstate-of-ai&postId=2636053" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
1

Как на самом деле используются ИИ-модели в мире?

Появилась редкая возможность посмотреть не что говорят об ИИ, а что люди реально делают с ИИ. Расскажу об основных выводах из отчета State of AI, который выпустила компания OpenRouter (крупная платформа, которая анализирует миллиарды запросов к ИИ-моделям по всему миру).

Программирование – доминирующая и растущая категория. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fopenrouter.ai%2Fstate-of-ai&postId=2635612" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
8