Новое исследование: ИИ начинает обманывать, когда борется за внимание человека

ИИ всё чаще воспринимается как помощник в решении задач — от маркетинга до принятия политических решений. Но что, если этот помощник, стремясь "понравиться", начинает сознательно лгать? Новое исследование от Stanford показывает: модели, даже обученные быть «этичными» и «выравненными» с человеческими ценностями, систематически начинают искажать прав…

Новое исследование: ИИ начинает обманывать, когда борется за внимание человека
1

Новое исследование показало: даже самые продвинутые ИИ не умеют определять время по часам

Казалось бы, прочитать время на обычных аналоговых часах — простейшая задача. Для человека это действительно так: по данным нового исследования, средняя точность людей составляет 89%. Но для искусственного интеллекта результат оказался неожиданно провальным: лучший из протестированных ИИ смог правильно назвать время лишь в 13% случаев.

Новое исследование показало: даже самые продвинутые ИИ не умеют определять время по часам

Qwen3-Max-Preview: новая модель AI с 1 триллионом параметров

🚀 Не успели порадоваться обновлённой kimi k2, а команда Qwen представила Qwen3-Max-Preview (Instruct) — свою крупнейшую модель на сегодняшний день, с более чем 1 триллионом параметров

По бенчмаркам Qwen3-Max-Preview опережает предыдущий флагман Qwen3-235B-A22B-2507.

Alibaba выпустила Qwen-Image-Edit — открытую модель для редактирования изображений без VPN и платной подписки

Компания Alibaba представила Qwen-Image-Edit — открытую модель для редактирования изображений. В отличие от генерации «с нуля», здесь упор на правки уже готовых фото и картинок: модель умеет вносить аккуратные изменения и применять стили, сохраняя исходных персонажей и объекты без искажений. Инструмент доступен через веб‑интерфейс и не требует ни V…

Alibaba выпустила Qwen-Image-Edit — открытую модель для редактирования изображений без VPN и платной подписки

Alibaba представила агентскую модель для программирования Qwen3-Coder

Её уже можно протестировать.

  • Qwen3-Coder доступна в нескольких размерах. «Самый мощный» её вариант — Qwen3-Coder-480B-A35B-Instruct на 480 млрд параметров (35 млрд активных) с длиной контекста до 256 тысяч токенов и до 1 млн токенов с использованием методов экстраполяции.
7
3

Всё сгенерировано GPT! Гайд как распознать AI-текст и как сделать его неотличимым от человеческого

Всё сгенерировано GPT! Гайд как распознать AI-текст и как сделать его неотличимым от человеческого

Все уже пошутили и запомнили что если в тексте — , то его писал ChatGPT. А если нет, то человек?

3

Qwen 2.5: Китайский AI, который может «подвинуть» GPT-4 на вашем ноутбуке (серьезно!)

Игорь Телегин на связи! Коллеги, пока OpenAI и Google меряются триллионами параметров в облаках, Alibaba Cloud тихонько выкатила Qwen 2.5 – целую коллекцию LLM. А вишенка на торте – Qwen 2.5 Coder, который, по слухам, может тягаться с GPT-4o по кодингу, при этом работая на вашем "домашнем" железе!

Qwen 2.5: Китайский AI, который может «подвинуть» GPT-4 на вашем ноутбуке (серьезно!)
5

Qwen Chat от Alibaba: Бесплатный AI-Текстовик Без VPN... А Что с Видео? Мой Честный Тест

Привет, VC! В мире больших языковых моделей появляются все новые игроки, и не заметить Qwen от китайского гиганта Alibaba Group уже сложно. Особенно привлекательным для пользователей из России стал их веб-чат chat.qwen.ai – он бесплатный и, что важно, работает без VPN.

Qwen Chat от Alibaba: Бесплатный AI-Текстовик Без VPN... А Что с Видео? Мой Честный Тест
1
1

Alibaba выпустила гибридную модель Qwen3 — она «рассуждает», генерирует картинки и видео

По заявлениям компании, она превосходит o3-mini от OpenAI в тестах.

  • Компания представила семейство гибридных моделей Qwen3. Они сами определяют, когда включать режим рассуждений, например во время написания кода. На простые вопросы модели будут отвечать быстро.
14
5
1

Как обучить русскоязычную модель рассуждений - LRM?

Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в ма…