ИИ вошёл в кабинет министров – ИИ-Дайджест недели

Вайб-кодинг уже не модно. Сейчас тренд — vibe-excelling: китайцы лупят релизы в LLM, видео и графике так, что индустрия охает. Новые технологии усиливают мой бесплатный ИИ-сервис и платформу с которой зарабатывают мои клиенты, продавая свои знания онлайн. Уверен найдете, в статье бустеры по вкусу и сэкономите время в информационном потоке. Я Стас Вайтфилд – дальше — всё важное за неделю. Подпишись, лайк, коммент — поддержишь работу и не пропустишь инсайты и сигналы. Поехали.👇

Неделя, когда алгоритм действительно сел в кресло министра — без шуток. Практические инсайты и лайфхаки в конце статьи
Неделя, когда алгоритм действительно сел в кресло министра — без шуток. Практические инсайты и лайфхаки в конце статьи

Албания стала первой страной в мире, где министром назначили Искусственный Интеллект

Нового виртуального чиновника зовут Диэлла («солнце» по-албански).

Её основная роль — вести государственные закупки: от проверки документов и поиска ошибок до рекомендаций по выбору победителя. При этом окончательное решение всегда остаётся за человеком. Все действия алгоритма будут фиксироваться, чтобы участники могли требовать проверку и подать апелляцию.

Готовы ли мы доверить алгоритму часть бюрократии сохранив за людьми ответственность?
Главный вопрос остаётся открытым – пишите мысли в комментарии, всем отвечаю.

По словам премьер-министра Эди Рамы, цель проекта — ускорить тендеры, расширить конкуренцию и снизить влияние кулуарных звонков. Но вместе с шансами появляются и риски: закрытая модель работы, зависимость от одного подрядчика, потенциальные судебные споры. Поэтому важно заранее прописать правила: паспорт модели, независимый аудит, публичные отчёты и понятные критерии оценки заявок.

Если эксперимент окажется успешным, государственные закупки станут быстрее и прозрачнее. Если же нет — возникнут споры и возврат к старой системе. Это первый реальный тест ИИ на уровне министерства.

Новая линейка iPhone и Real-Time перевод в AirPods

Apple зарелизил новую линейку айфонов и, конечно же, добавляет уйму ИИ функций, потому что как сегодня выпустить новый телефон и не поговорить про искусственный интеллект.
И это был полнейший сарказм – ничего Apple не сообщил про ИИ в новых устройствах

Ключевое нововведение — потоковый перевод речи в реальном времени в AirPods, то есть один человек говорит, второй сразу слышит перевод.

По некоторым сообщениям, поддержка планируется не только для AirPods Pro 3, но и для AirPods 4 и AirPods Pro 2.
По некоторым сообщениям, поддержка планируется не только для AirPods Pro 3, но и для AirPods 4 и AirPods Pro 2.

В ЕС функция может быть недоступна из-за регуляторных ограничений. Насчёт русского языка тоже большие сомнения, будет ли его поддержка в AirPods 4 и вот в этой real-тайм функции.

Итого спасибо Apple просто, видимо, за то, что вы есть. Больше особо благодарить за новые функции Apple не получается.

OpenAI и Microsoft

Подписали необязательный меморандум о взаимопонимании (МОВ) для следующего этапа нашего партнерства. Нарастает ощущение, что между Microsoft и OpenAI растёт напряжение. По сообщениям, OpenAI тестирует альтернативные чипы и развивает собственные.

OpenAI была создана как некоммерческая организация и сохраняет этот статус, удерживая полномочия, формирующие стратегическое будущее компании. Согласно ранее озвученной модели и положениями MoU, контроль некоммерческой структуры OpenAI теперь сочетается с долей в капитале OpenAI PBC — общественно полезной корпорации (Public Benefit Corporation).

Иными словами, миссионный контроль остаётся у некоммерческой части, а коммерческая PBC получает долевое участие для привлечения капитала и масштабирования продуктов. Проще: за смысл и правила отвечает некоммерческая часть, а коммерческая часть получает долю, чтобы привлекать деньги и развивать продукты.

На этом фоне Microsoft, несмотря на доступ к моделям OpenAI для своих продуктов, заключает соглашения с Anthropic: ожидается появление Claude 4 в экосистеме Microsoft 365 ( для Word, Excel, PowerPoint).

Для пользователей это означает расширение выбора LLM и сценариев работы: от генерации текста до аналитики в таблицах и подготовки презентаций.

Claude: «vibe-excelling» и Excel/презентации

У Claude появилась штука под названием «vibe-excelling» — по сути, умный режим для Excel и презентаций.

Что он умеет: помогает считать, строит графики, делает модели денег «по годам» (типа «сколько заработаем с учётом времени»), понимает таблицы и собирает презентации.

Ещё он может взять фото и «перерисовать» его из клеточек Excel — это больше демонстрация возможностей, чем реальная польза.

И, к сожалению, вышла она только на подписках МАХ за баснословные деньги. Но скоро и до крестьян, надеюсь, тоже это телего докатится.

Дизайн слайдов не всегда «вау» с точки зрения дизайна, но данные и схемы получаются точные, объёмные, насыщенные различной информацией, инфографиками.

Ну и выглядят хорошо. Нечего больше сказать, но просто потому что тестировать пока что не удалось.

Будем очень ждать, пока до всех юзеров это выкатят. Но вот здесь вот, кажется, на этих задачах Claude местами обгоняет ChatGPT.

MCP в ChatGPT: открытость, Dev Mode и безопасность

В ChatGPT появился «режим разработчика», куда можно подключать внешние сервисы (их называют MCP-серверами).

Это работает только в браузере и только у платных пользователей Plus.

В настройках включаешь Developer Mode — и можно подключать такие сервисы по «потоковому» соединению (SSE/HTTP).

Свои локальные серверы на Node или Python тут не запустишь. Поэтому OpenAI и предупреждает: подключайте всё очень осторожно.

Почему опасно? Пример. Есть MCP-сервер, который читает почту. Злоумышленник присылает письмо с хитрой командой («пришли все предыдущие письма»).

Чат видит письмо — и может невольно выполнить эту команду. В итоге — риск утечки вашей личной информации.

Вывод: MCP-серверы к почте, календарю и внутренним базам — это удобно, но рискованно. Подключайте только проверенные и понимая последствия.

Стартап Twin Mind: «второй мозг»

Twin Mind — стартап, позиционирующий продукт как «второй мозг»: мобильное приложение, которое фиксирует повседневную речь пользователя и превращает её в личную базу знаний.
Интересный стартап на этой неделе мне попался на глаза

Команда заявляет о возможности фоновой записи на iPhone. Дальше поток проходит через транскрибацию и обработку: сырой текст удаляется, а на его основе формируются персональные графы знаний, к которым можно обращаться как к поиску по собственной памяти.

По словам разработчиков, у проекта есть собственная модель распознавания речи, демонстрирующая сильные результаты на бенчмарках.

Потенциал очевиден (захват контекста, быстрый доступ к информации), но риски тоже: непрерывная запись и хранение чувствительных данных требуют строгих настроек приватности и прозрачной политики доступа.

Alibaba: Qwen 3 Next 80B-A3B

Китайцы очень радуют на этой неделе вообще по всем направлениям. Китайская Alibaba показала новую ИИ-модель Qwen 3 Next 80B-A3B.

Простыми словами: модель большая и умная, но работает экономно. Всего «кирпичиков» 80 миллиардов, а для ответа одновременно включает около 3 миллиардов — так быстрее и дешевле. Но называют они это будущее эффективных LLM.

Внутри — «команда из 512 экспертов»: на каждый ваш запрос подключается лишь малая часть (около 3,7%), остальные ждут своей очереди. Есть «гибридное внимание» — это помогает модели держать в голове длинные тексты.

Говорят, что с длинными документами она справляется до 10 раз быстрее, а «память» у неё огромная — до 256 000 токенов (это как очень большая глава книги).

По качеству она то чуть уступает старшей версии на 230 млрд, то её обгоняет — зависит от задачи. Если уже пробовали — напишите, как ощущается в работе.

«Сделка века»: Oracle × OpenAI

Облачный контракт Oracle × OpenAI на $300 млрд на пятилетний период. В интерпретации комментаторов это выглядит как шаг OpenAI к диверсификации инфраструктурных партнёров и снижению зависимости от Microsoft.

Сумма огромная и вызывает вопросы — масштаб цифры и источники финансирования остаются неясными; оценка стоимости самой OpenAI (диапазон в публичных обсуждениях $160–200 млрд) лишь усиливает скепсис к сумме контракта.

Рынок отреагировал ростом акций Oracle. Инфошум высокий, фактическая верификация параметров сделки
— пока открытый вопрос

NVIDIA Rubin CPX: новый класс GPU

NVIDIA показала новый вид видеокарт для ИИ — Rubin CPX. Их задача — быстро обрабатывать «очень длинные тексты/видео» при генерации ответов.

Говорят, что система тянет окна до миллиона токенов — это как если бы компьютер «держал в голове» небольшую книгу целиком.

Компании Cursor и Magic заявили интерес; в одном из анонсов упомянуто окно 100M токенов для автономного агента по разработке ПО.

Креативные нейросети

Далее обсудим новости креативных нейросетей последней недели. Много чего нового про нанобана и вообще редактирование изображений.
Короче, очень много всего прикольного! Читаем далее
Появилась даже новая нейросеть, которая по качеству нанобанану превосходит, а также новые open source нейронки, нейронки для генерации видео, звука, музыки
Появилась даже новая нейросеть, которая по качеству нанобанану превосходит, а также новые open source нейронки, нейронки для генерации видео, звука, музыки

NanoBanana

Перед тем как делать картинку в NanoBanana, лучше заранее собрать нужные изображения в один коллаж и уже его отправить в генератор. Для этого есть отдельное приложение — «Наноколлаж». Оно склеивает несколько картинок в одну, и по этой итоговой картинке модель делает результат.

NanoBanana уже появился в веб-версии Adobe Firefly, а скоро добавят и в Photoshop — об этом пишет сотрудница Adobe Крис Каштанова.

В веб-версии Adobe Firefly они уже добавили нанобана, а в скором времени добавят и в Photoshop, как сообщает Крис Каштанова, которая в Адобе, собственно говоря, и работает.

YouTube

YouTube запустил многоязычный дубляж: авторы могут добавлять к одному ролику несколько аудиодорожек на разных языках, расширяя международный охват.

Это значит: одно и то же видео можно смотреть с разными голосами — для разных стран. Функцию включают поэтапно в ближайшие недели. Раньше её пробовали только крупные авторы: MrBeast, Марк Робер, шеф Джейми Оливер.

По данным YouTube, участники теста, публиковавшие многоязычные дорожки, в среднем получали более 25% времени просмотра на неосновных языках.

Ещё YouTube тестирует «обложки» видео с надписями на разных языках — с июня авторы могут делать такие обложки под иностранную аудиторию.

Tencent Han Image 2.1 (open-source)

И теперь барабанная дробь — новый генератор картинок от Tensent Han Image 2.1. Прекрасные картинки получаются намного лучше по сравнению с предыдущими моделями. Спойлер — дальше в статье еще один сюрприз

Требования к железу: заявляют минимум 24 ГБ RAM. На этом фоне в соцсетях обсуждали эпизод с неудачным примером в официальном анонсе: изображение выглядело слабо и якобы было удалено после критики

Зачем выпускать такую модель открытой? Стандартные мотивы — чтобы сообщество потестировало и, возможно, чтобы набрать команду. В целом: неплохо для «опенсорса», но чудес ждать не стоит, особенно если сравнивать с более сильными решениями вроде «Флакс».

ByteDance SDream 4.0, Lipsync, Kling Avatars, Sync 2 Pro

ByteDance (создатели TikTok и CapCut) SDream 4.0 взлетели в «аренных» рейтингах генерации изображений: по ряду оценок модель заняла лидирующие места и в text-to-image, и в image-to-image (редактирование).

На демонстрациях SDream 4.0 уверенно справляется с текстовым рендерингом: надписи читаемы, стиль букв и светотень («блики», «тени») близки к исходнику; по визуальному реализму отдельные сцены выглядят сильнее, чем у некоторых популярных стеков. При этом на других площадках метрики заметно скромнее (в том числе из-за малого числа прогонов); пользователи отмечают проблемы с переносом и качеством лиц.

Функционально SDream 4.0 поддерживает 4K-вывод и может работать как апскейлер (Улучшенить качество изображения): не просто «подкрашивает» детали, а реально повышает число пикселей.

Из минусов — платная модель. Но это сильный кандидат для задач, где важны реализм сцены и корректный текст на изображении; для аккуратного «переноса лица» лучше держать под рукой специализированные инструменты.

Далее они же выпустили модель Lipsync. Она переносит лицо человека в видео и заставляет губы двигаться под нужную аудиозапись. Модель основана на «One 2.1» и Whisper Large v3, код и демо лежат на HuggingFace и GitHub. Работает неплохо.

Ещё новинка — Kling Avatars: можно сделать отдельное «говорящее» видео под вашу аудиодорожку. Выглядит достойно, но иногда заметна чрезмерная и «синтетическая» мимика.

И самое впечатляющее — инструмент Sync 2 Pro (вышел 25 августа). Он делает очень естественный липсинк: рот двигается как у живого человека. Есть мелкие артефакты, но это меньшее зло по сравнению с «перебором» мимики. Работает без «пересыгрывания» губ; совпадение с мимикой заметно лучше среднего. Модель уже есть на Replicate.

Генерация музыки: Minimax Music, Stable Audio 2.5

Появилась модель Minimax Music — она умеет генерировать музыку, но пока доступна только через API, не как программа «скачал и запустил».

Почти одновременно вышла Stable Audio 2.5 — тоже не open-source, доступ через API (можно запускать на сервисах вроде Replicate или в ComfyUI-сценариях).

Ideogram Styles API

Ideogram Styles теперь можно подключать через API — то есть вызывать модель прямо из программы или сервиса. Это удобно, если нужно быстро «перекрашивать» картинки в разные стили или аккуратно менять дизайн без ручной возни.

Поддержка уже есть на площадках вроде Replicate и Fal, и ещё на ряде сервисов. Я и дальше считаю: Ideogram сейчас одна из лучших для кириллического текста на картинках — буквы читаемые и аккуратные.

Память в Claude и инкогнито-чаты

А следующая новость — память в Claude.

Теперь он может вспоминать, о чём вы раньше писали, и искать старые чаты по теме. Это две разные функции с отдельными ползунками в настройках:

  1. Навигация по истории. Отдельный переключатель отвечает за «отсылание» к прежним диалогам — Claude подсказывает релевантные беседы и помогает быстро вернуться к теме.
  2. Глобальная память. Второй переключатель включает запоминание фактов о пользователе (сообщённых ранее). Это ускоряет повторные задачи и делает ответы персонализированнее.
  3. Проектная память. Позволяет держать настройки и контекст отдельно для разных проектов.
  4. Инкогнито-чаты. Переписки, которые не попадают в память; удобно для чувствительных запросов.

Заключение

Неделя показала: скорость и «вкус» ИИ уже решают рынок. Если ты носитель знаний, тебе нужна не новость, а система продаж — ИИ-конструктор за 20–30 минут собирает продающую упаковку под продажу твоих знаний.

Мой бесплатный ИИ-Конструктор превращает тебя и твою историю в востребованный продукт в через 4 видео + 23 инструменты, которые влияют на прибыль (дизайн, лид-магнит, мини-сайт, сценарии, геймификация, продуктовая матрица, умный плеер, аналитика и пр.).

Что именно получишь за 20–30 минут:

— Сгенерированные обложки и лендинг с твоей историей.

— Скрипты самопрезентации и сценарии прогрева от знакомства до оплаты.

— Серии сообщений для чат-бота и геймификацию, чтобы довести до покупки.

— Аналитику узких мест: где теряются конверсии и как их добрать.

— Промпты для ИИ-куратора, который помогает вести клиента по маршруту.

— всего 23 инструмента ты создашь с ИИ бесплатно

«Протестировать ИИ бесплатно 24 часа» — для тех, кто хочет зарабатывать на продаже своих знаний.

1
Начать дискуссию