ИИ-модели обладают знаниями аспиранта, но решают зрительные задачки на уровне трёхлетнего ребёнка: учёные предложили новый бенчмарк BabyVision

Современные мультимодальные модели искусственного интеллекта уверенно сдают экзамены на уровне аспирантуры. Они решают задачи по математике, рассуждают о философии и набирают более 90% на сложных тестах, рассчитанных на экспертов. Однако новое исследование показывает, что за пределами языковой плоскости их способности не настолько развиты. Даже сам…

ИИ-модели обладают знаниями аспиранта, но решают зрительные задачки на уровне трёхлетнего ребёнка: учёные предложили новый бенчмарк BabyVision
1

Реклама в ИИ-ассистентах: OpenAI делает ставку на масштаб, конкуренты — на доверие пользователей

Рынок ИИ-ассистентов всё ещё не нашёл устойчивую модель монетизации, и отношение к рекламе стало одной из ключевых линий раздела между крупными игроками. Поводом для нового витка обсуждения стали слова главы Google DeepMind Демиса Хассабиса, который на форуме в Давосе публично выразил удивление тем, что OpenAI так быстро перешла к тестированию рекл…

Реклама в ИИ-ассистентах: OpenAI делает ставку на масштаб, конкуренты — на доверие пользователей
1

ШАХ И МАТ, кожаные мешки! Инструкция по поимке ИИ стала его лучшим учебником.

ШАХ И МАТ, кожаные мешки! Инструкция по поимке ИИ стала его лучшим учебником.

Помните волонтеров Википедии, которые годами собирали гайд "Signs of AI writing", чтобы вычислять и банить машинные тексты? Так вот, разработчик Сики Чен просто скормил этот список Claude Code.
Итог: родился скилл Humanizer, который за неделю собрал 2000 звезд на GitHub. Мы официально вошли в эру, когда ИИ учится быть человеком, читая список того, ч…

1
1
1

От DeepSeek до Sora 2: ключевые моменты года в мире ИИ

2025 год стал для индустрии искусственного интеллекта не просто насыщенным, а показательным. Если раньше ключевые новости касались отдельных моделей или стартапов, то в этом году ИИ всё чаще оказывался в центре событий, затрагивающих финансовые рынки, государственные стратегии и массовую культуру.

От DeepSeek до Sora 2: ключевые моменты года в мире ИИ
1

Anthropic продолжила эксперимент с ИИ-продавцом: результаты работы робота спустя полгода

Anthropic опубликовала результаты второй фазы эксперимента Project Vend — проекта, в котором ИИ-модель управляет реальным торговым автоматом с едой. Это продолжение летнего эксперимента, закончившегося убытками и серией странных сбоев, когда виртуальный продавец по имени Claudius путался в платежах и даже принимал себя за человека.

Anthropic продолжила эксперимент с ИИ-продавцом: результаты работы робота спустя полгода
1

Ведущие ИИ-модели приблизились к максимальным результатам на профессиональных финансовых экзаменах

Опубликованы результаты нового исследования, посвящённого тому, как современные языковые модели справляются с экзаменами CFA — одной из самых жёстких профессиональных сертификаций в сфере финансов. Авторы работы проверили сразу несколько ведущих ИИ-систем и зафиксировали результаты, которые ещё недавно казались недостижимыми.

Ведущие ИИ-модели приблизились к максимальным результатам на профессиональных финансовых экзаменах
1

Стихи против защит: поэтическая форма промпта резко повышает эффективность джейлбрейков ИИ

Поэтическая форма неожиданно оказалась самым надёжным способом обойти защитные фильтры современных языковых моделей. Новое исследование итальянских университетов и лаборатории DEXAI Icaro показало: достаточно переформулировать вредоносный запрос в рифму — и большинство систем безопасности перестают его распознавать. В ряде случаев «поэтический джей…

Стихи против защит: поэтическая форма промпта резко повышает эффективность джейлбрейков ИИ
2
1

Как делать продающие изображения в Midjourney: 7 шагов, которые повышают кликабельность до 45%

Как делать продающие изображения в Midjourney: 7 шагов, которые повышают кликабельность до 45%

Как бизнесу создавать продающие изображения в Midjourney? Разбираю пошаговый процесс: от выбора стиля до написания промптов, добавляю цифры, примеры и советы, которые повышают конверсию на 15-45% в рекламных кампаниях.

Модели Claude могут распознавать и описывать собственные внутренние состояния

И даже управлять ими, но пока слабо Это то, что называется «интроспективная осознанность». Что это означает и могут ли модели "думать по заказу"? Читайте!

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftransformer-circuits.pub%2F2025%2Fintrospection%2Findex.html&postId=2312195" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
2

Языковые модели научились осознавать свои мысли (но это ненадёжно)

Источник: Anthropic

Исследователи Anthropic опубликовали работу о том, что современные LLM обладают базовой формой интроспекции — способностью замечать и сообщать о своих внутренних состояниях.

1

Anthropic и Google ведут переговоры о контракте на десятки миллиардов долларов. Amazon нервничает

Создано автором

Пока все ещё не отошли за войной AI-браузеров, за кулисами разворачивается куда более серьёзная битва — за облачную инфраструктуру для AI.

2

КАК УВЕЛИЧИТЬ ВЫРУЧКУ С ПОМОЩЬЮ ChatGPT: 5 ИИ-ПРОМТОВ ДЛЯ СКРИПТОВ ПРОДАЖ, КОТОРЫЕ РАБОТАЮТ НА 30% ЭФФЕКТИВНЕЕ

КАК УВЕЛИЧИТЬ ВЫРУЧКУ С ПОМОЩЬЮ ChatGPT: 5 ИИ-ПРОМТОВ ДЛЯ СКРИПТОВ ПРОДАЖ, КОТОРЫЕ РАБОТАЮТ НА 30% ЭФФЕКТИВНЕЕ

Используйте нейросети для автоматизации продаж. 5 эффективных промтов ChatGPT, которые повышают конверсию и выручку бизнеса на 30%.

1