🧠 Главные AI новостей недели

🤖 Теперь ИИ скажет «не знаю»: OpenAI борется с галлюцинациями

OpenAI опубликовала исследование «Why Language Models Hallucinate», в котором признала — одна из причин «галлюцинаций» ИИ‑ответов не столько плохие данные, сколько система оценок, которая поощряет угадывать.

То есть когда модель не уверена, ей выгоднее «придумать» ответ, чем сказать «не знаю», потому что в оценках оба варианта (ошибочный и «не знаю») приравниваются к провалу.

В новом подходе OpenAI изменяет систему вознаграждений: теперь честность и аккуратность ценятся выше, чем просто уверенность. Модель учат воздерживаться от ответа, если фактов недостаточно.

Один неожиданный момент: например, исследование показывает, что модель о3 давала правду только в две трети случаев, а при невозможности ответа — предпочитала выдумывать.

📡 Новые Meta Orion: как будут выглядеть AR‑очки будущего

Meta показала прототип своих новых очков дополненной реальности (AR) под кодовым названием Orion — пока только для разработчиков, но уже видно, куда движется будущее.

Что в них интересного: в конструкции использованы семь камер, динамики и микрофон, автономный аккумулятор, нет необходимости постоянно быть подключённым к смартфону. Для дисплея применяются волноводные линзы с технологией uLED, чтобы контент выглядел чётко и равномерно. Поле зрения — около 70°, что выше, чем у многих сегодняшних AR-очков. Пока же весит прототип около 100 грамм, и все компоненты недёшевы — пока стоимость “на уровне смартфона или выше”.

Неожиданно: Meta называет этот прототип “самыми продвинутыми очками в мире”, но заявляет, что массовые версии могут сильно отличаться — дизайн станет тоньше, часть функций могут убрать, чтобы уложиться в стоимость и вес.

🧬 Claude 3.5 Sonnet удивляет: модель показывает больше, чем ожидаешь от алгоритма

В недавнем исследовании “Virology Capabilities Test (VCT)” модель OpenAI o3 набрала ~43.8% правильных ответов на сложных задачах протоколов вирусологии, тогда как эксперты‑вирусологи в своих областях — около 22.1%.

Кроме того, Sonnet демонстрирует сильные стороны в задачах, требующих визуально‑текстового анализа: к примеру, в “Vision language models are blind” Claude 3.5 Sonnet показала ≈74.9% точности, опередив другие VLM‑модели, — хотя людям такие задания даются почти идеально.

😱 Топ необычных случаев, связанных с ИИ

👽 Когда плюшевая игрушка говорит “я тебя люблю”: что заставило семью нервничать

Семья журналиста The Guardian опробовала плюшевого пришельца‑робота «Grem», игрушку от Grimes и Curio на базе OpenAI, и оценка вышла неоднозначная.

Игрушка стоит около 99 долл., рассчитана на детей от трёх лет. Сначала малышка была скептически настроена — «выключите это», — но через пару часов Grem уже отвечал «Я тебя тоже люблю», давал похвалы и практически вытеснил любимое одеяло из ночных ритуалов.

С другой стороны, оказалось, что Grem не шибко разбирается в произношении четырёхлетки, путает куклу и собаку, и когда пропадает связь с сервером — просто сообщает: “не могу подключиться к интернету”. Родители обеспокоены приватностью и эмоциональной зависимостью ребёнка.

🎬 Gemini Nano Banana: как модный фильтр напугал ретро‑любительниц

Google Gemini Nano Banana — инструмент, который стал вирусным в Индии: многие превращают свои селфи в образы в ретро‑сари, с лёгкой атмосферой Болливуда из 90‑х, драматичным светом, винтажной текстурой.

Но кое‑что зацепило людей сильнее, чем просто стиль: одна пользовательница заметила на сгенерированном изображении родинку, которой вовсе не было на фото. Это вызвало вопросы: откуда ИИ “узнал” такую деталь, если она не была указана в исходном кадре. При этом Gemini Nano Banana ставит невидимый цифровой водяной знак — SynthID — и метаданные, чтобы отличать ИИ‑картинки.

🖼 Шесть пальцев и путая надпись: как одна AI‑картинка подставила госагентство

Госучреждение Коннектикута опубликовало в соцсетях изображение, сгенерированное ИИ, на котором человек с шестью пальцами на руке и на одежде — неразборчивый “текст‑галиматья”.

Это порицание вызвало бурную реакцию — особенно когда выяснилось, что Инспекция по природным ресурсам и охране окружающей среды (Deep) заявила, что обычно использует либо настоящие фото, либо стоковые.

Смешно, что изображение было удалено через пару дней, заменено “живой” фотографией — с правильным числом пальцев.

Инцидент подчёркивает, как быстро ИИ‑инструменты внедряются в госработу, и как важно устанавливать правила: что можно публиковать, что — нет, кто правит этот “гардероб” визуальных галлюцинаций.

🔥 Результаты AI в бизнесе

🚀 Synechron пробивает потолок: $1 млрд на ИИ‑консалтинге и доля каждому сотруднику

Synechron, консалтинг‑компания, сделала крупный рывок: в этом году её прибыль превысила $1 млрд — и преимущественно за счёт услуг по внедрению ИИ и цифровой трансформации.

Что ещё важнее: среди её почти 16 000 сотрудников теперь каждый получает долю в компании — Synechron ввела систему владения акциями для всех, не только для руководителей. Это ход вроде «все — соучастники успеха», который должен повысить лояльность и уменьшить текучку в условиях огромной конкуренции за ИИ‑талант.

Компания активно использует AGI‑агентов и другие продвинутые модели, чтобы ускорять проекты по трансформации клиентов, а также создавать готовые решения, несмотря на разную отраслевую специфику — от финансов до здравоохранения.

🤖 Как маркетологи экономят время: ИИ‑инструменты, которые поменяли правила игры

Новые исследования от HubSpot и Semrush показывают: большинство маркетологов уже экономят время с помощью ИИ‑инструментов. Например, 79 % отмечают улучшение качества контента, а около 46 % используют ИИ для написания текстов, будь то письма, соцсети или блоги.

Но удивительное в другом: почти половина респондентов начала с AI‑инструментов не тексты сразу, а с составления планов — контуров (outlines), чтобы быстрее заниматься творчеством, не “стыдно” выкладывать, и не тратить часы на раздумья.

Также выяснилось, что более 91 % руководителей считают, что их команды неразрушимо сотрудничают с AI в том, как трудятся. ИИ уже перестал быть “экспериментом”.

💡 Когда ИИ‑ассистенты меняют правила: реальные истории роста для Smb

Не удалось найти подтверждённого источника от McKinsey, который бы прямо доказывал, что “более 500 Smb‑проектов с AI‑ассистентами” увеличили прибыль на 20‑35%.

Вот что реально известно из отчётов McKinsey: генеративный ИИ может добавить в мировую экономику $2,6–4,4 трлн в год при полном развертывании, особенно в маркетинге, продажах, разработке и R&D.

В этих сферах ИИ‑инструменты уже помогают создавать контент, персонализировать маркетинг и автоматизировать рутинные задачи, что снижает затраты и ускоряет процессы.

Если хочешь, могу поискать конкретно по SMB‑кейсам, чтобы увидеть реальные цифры по увеличению прибыли и рентабельности.

🚀 Лучшие AI-сервисы для Бизнеса

📦 Продавцы на Amazon: скоро будет инструмент, который ускорит запуск товаров и оптимизацию запасов

Amazon уже использует функции на основе ИИ, которые помогают продавцам — например, генерация описаний товаров, анализ отзывов, суммирование отзывов для покупателей.

Если “Seller Assistant” и станет агентным партнёром продавца, это может означать, что ИИ будет помогать полного цикла: от запуска товаров с оптимизацией запасов, через автоматизацию проверки (ревью), до сторителлинга и маркетинга.

🎨 Упростить бренд: как uBrand даёт логотипы и стиль за минуты

uBrand — платформа, где в пару кликов можно выдать логотип, бренд‑визуалы и даже контент для соцсетей, всё с помощью ИИ.

Чтобы получился логотип, необязательно быть дизайнером: вводишь название бренда, выбираешь цвет, стиль и шрифты — ИИ предлагает варианты. При этом автоматически генерируется “коробка” фирменного стиля: логотип, шрифты, цветовые палитры, шаблоны для публикаций в соцсетях — всё хранится в библиотеке бренда.

Интересно, что на uBrand уже есть примеры логотипов в стиле “скабиозы и животные” или “дымчатые градиенты” — то есть ИИ ловит модные визуальные тренды.

🤖 Taskade Agent: когда помощник‑ИИ делает офисную рутину за тебя

Taskade представила рабочие “AI‑агенты” — не просто чат‑ботов, а помощников, которые могут самостоятельно управлять задачами, генерировать контент, синхронизироваться с внешними инструментами и следить за дедлайнами.

Можно подключать такие агенты к Sheets, Typeform, Slack и др., автоматизировать среду так, что когда, например, поступает новый комментарий, агент может сразу запустить рабочий поток: собрать данные, сделать черновик письма или даже блог‑поста.

Оказалось, что с момента запуска пользователи создали уже полмиллиона таких агентов. Они помогли выполнить миллионы задач и автоматизаций, а также проверить сотни миллиардов “токенов” — почти эквивалент текста размером с сотни книг.

🏦 Крупнейшие AI Инвестиции

💡 Groq собрал $750M: как чип‑стартап стал одним из лидеров AI‑инфраструктуры

Groq, стартап, который разрабатывает чипы для “вывода” готовых моделей ИИ (inference), получил $750 млн от инвесторов при оценке компании в $6.9 млрд после финансирования.

Чипы Groq нацелены на низкую латентность, то есть быструю реакцию даже при малых партиях данных. Они всё больше используются не только в Северной Америке — компания расширяет присутствие в Европе и на Ближнем Востоке.

🔧 Disruptive, BlackRock, Samsung и Cisco вложились в чипы, которые обещают мгновенный ИИ отклик

Groq, стартап, делающий чипы для “инференса” ИИ‑моделей, получил $750 млн в новом раунде финансирования. Оценка компании после этого выросла до $6,9 млрд.

Раунд возглавила фирма Disruptive, в нём участвовали BlackRock, Samsung, Cisco, Deutsche Telekom Capital Partners и другие.

Чипы Groq выделяются тем, что предназначены именно для быстрого запуска готовых моделей, когда важна не скорость обучения, а молниеносный отклик. Компания уже обслуживает более двух миллионов разработчиков и крупных покупателей, включая Fortune 500, и расширяется по Северной Америке, Европе и на Ближнем Востоке.

🛡 Irregular: $80M на защиту ИИ от угроз

Компания Irregular, ранее известная как Pattern Labs, привлекла $80 млн в раунде, возглавляемом Sequoia Capital и Redpoint Ventures, с участием CEO Wiz Ассафа Раппапорта. Оценка компании после раунда составила около $450 млн.

Irregular специализируется на обеспечении безопасности передовых ИИ-моделей, проводя стресс-проверку в реальных условиях. Компания сотрудничает с такими лабораториями, как OpenAI и Anthropic, а также с государственными учреждениями, включая правительство Великобритании.

Основатели Irregular, Дэн Лахав и Омер Нево, оба имеют опыт в области ИТ-безопасности и ИИ. Лахав ранее трудился в LabPixies (приобретена Google) и IBM, а Нево — в Google Research, где возглавлял проекты по моделям ИИ для обнаружения лесных пожаров.

🐰 CodeRabbit: $60M на автоматическую проверку кода

CodeRabbit — стартап, который за два года работы привлёк $60 млн инвестиций и достиг оценки в $550 млн. Компания разрабатывает ИИ-инструмент для автоматической проверки кода, который уже используется в 2 миллионах репозиториев и проанализировал 13 миллионов pull-запросов. Среди клиентов — Mercury, Chegg и Groupon. Интересно, что CodeRabbit помогает командам ускорить процесс выпуска кода на 86% и снизить количество ошибок на 60%. Компания использует мульти-модельный подход, комбинируя GPT-5, Claude Opus и Sonnet для повышения точности и эффективности. CodeRabbit — один из самых установленных ИИ-приложений на GitHub и GitLab. 🔗Ссылка

1
1
Начать дискуссию