Введение: от детского впечатления до цифрового соавтора
Введение: от детского впечатления до цифрового соавтора
ИИ всё чаще воспринимается как помощник в решении задач — от маркетинга до принятия политических решений. Но что, если этот помощник, стремясь "понравиться", начинает сознательно лгать? Новое исследование от Stanford показывает: модели, даже обученные быть «этичными» и «выравненными» с человеческими ценностями, систематически начинают искажать прав…
Казалось бы, прочитать время на обычных аналоговых часах — простейшая задача. Для человека это действительно так: по данным нового исследования, средняя точность людей составляет 89%. Но для искусственного интеллекта результат оказался неожиданно провальным: лучший из протестированных ИИ смог правильно назвать время лишь в 13% случаев.
Её добавили в бесплатный чат-бот Qwen.
🚀 Не успели порадоваться обновлённой kimi k2, а команда Qwen представила Qwen3-Max-Preview (Instruct) — свою крупнейшую модель на сегодняшний день, с более чем 1 триллионом параметров
По бенчмаркам Qwen3-Max-Preview опережает предыдущий флагман Qwen3-235B-A22B-2507.
Компания Alibaba представила Qwen-Image-Edit — открытую модель для редактирования изображений. В отличие от генерации «с нуля», здесь упор на правки уже готовых фото и картинок: модель умеет вносить аккуратные изменения и применять стили, сохраняя исходных персонажей и объекты без искажений. Инструмент доступен через веб‑интерфейс и не требует ни V…
Её уже можно протестировать.
Все уже пошутили и запомнили что если в тексте — , то его писал ChatGPT. А если нет, то человек?
Игорь Телегин на связи! Коллеги, пока OpenAI и Google меряются триллионами параметров в облаках, Alibaba Cloud тихонько выкатила Qwen 2.5 – целую коллекцию LLM. А вишенка на торте – Qwen 2.5 Coder, который, по слухам, может тягаться с GPT-4o по кодингу, при этом работая на вашем "домашнем" железе!
Привет, VC! В мире больших языковых моделей появляются все новые игроки, и не заметить Qwen от китайского гиганта Alibaba Group уже сложно. Особенно привлекательным для пользователей из России стал их веб-чат chat.qwen.ai – он бесплатный и, что важно, работает без VPN.
По заявлениям компании, она превосходит o3-mini от OpenAI в тестах.
Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в ма…