Российские модели генеративного ИИ: чем они могут помочь бизнесу?

Составили подборку 22 сервисов для создания и обработки контента.

Обложку для этого обзора сгенерировала нейросеть
Обложку для этого обзора сгенерировала нейросеть

Исследования показывают, что 20% крупных российских компаний уже используют генеративный искусственный интеллект (ГенИИ). ГенИИ не только рисует картинки или пишет музыку, он может отвечать на вопросы, расшифровывать записи совещаний, составлять списки задач по туманным описаниям, которые вы ему наговорили.

И все же многие компании относятся к ГенИИ с осторожностью. Здесь есть два момента. Первый — формат поставки решения. 85% компаний не готовы взаимодействовать с ИИ в облаке: они опасаются утечки данных и готовы использовать нейронки только на своей ИТ-инфраструктуре. Второй повод для беспокойства — закон о персональных данных.

Наша практика показывает, что бизнесу спокойнее работать с технологией, когда серверы, на которых она поднята, данные и их владельцы находятся на одной территории.

А значит, бизнесу интересны российские решения.

Причем тут ИИ и аудиторско-консалтинговая компания «Технологии Доверия», подумаете вы. Дело в том, что мы много лет занимаемся ИТ-консалтингом, в частности у нас есть команда дата-саентистов, которая решает проблемы компаний с помощью искусственного интеллекта. Например, наши эксперты создали когнитивного помощника для нефтегазовой компании и обучили модель, которая отбирает лучшие деловые книги года. Мы внимательно следим за выходом коммерческих и Open Source решений. Так и появился этот обзор.

В обзоре мы систематизируем некоторые наиболее известные решения от российских вендоров, рассказываем о разнообразии генеративных моделей ИИ и продуктов на их основе. Сейчас готовим бенчмаркинг с деталями для техдиров. Если у вас есть идея, что важно туда включить — пишите, учтем в работе ваши комментарии.

Говоря о развитии моделей, важно обратить внимание на мультимодальность — способность работать с различными типами данных, такими как текст, изображения, аудио и видео. Она стремительно эволюционирует. Проще говоря, у ИИ все лучше развиты «органы чувств». Российские компании, например Сбер и Яндекс, не отстают от мировых, что открывает новые перспективы для бизнеса и рядовых пользователей.

Артём Семенихин
Партнер технологической практики ТеДо

Наш обзор не претендует на абсолютную полноту – это первая версия, в которой мы проанализировали, что умеют самые популярные на рынке решения, и собрали их в «каталог». Будем признательны за дополнения и комментарии: сейчас готовим бенчмаркинг с деталями для техдиров, и учтем ваши мысли в нем.

Оглавление

Следующая часть обзора устроена по схеме «провайдер – список его продуктов на базе генИИ – краткое описание особенностей продуктов». Если описания вам не интересны, сразу открывайте Карту провайдеров.

Сбер

Сбер создал более 500 моделей ИИ и решений на их основе. Многие выложены в открытый доступ и могут использоваться независимыми разработчиками. Кроме того, Сбер осуществляет экспертную, аналитическую и методологическую поддержку Правительства РФ в рамках реализации Национальной стратегии развития искусственного интеллекта.

С точки зрения продукта, Сбер создает чат-ботов, голосовых ассистентов и алгоритмы анализа данных, которые используются для улучшения качества обслуживания клиентов и оптимизации бизнес-процессов. Выделяются несколько основных сервисов.

GigaChat API работает на мультимодальной нейросети, способен решать самые разные интеллектуальные задачи: генерировать тексты и изображения по описанию, отвечать на вопросы пользователей, писать код.

Мультимодальная нейросеть не ограничена одним форматом, например, текстами. Чтобы поставить ей задачу, можно как написать сообщение, так и отправить картинку. Например, вы можете попросить ИИ нарисовать домик в лесу или отправить ей фотографию леса и попросить добавить дом и перерисовать в определенном стиле. Результатом работы такой нейросети также может быть текст, картинка или звук — смотря чему вы ее обучите.

SaluteJazz умеет автоматически убирать посторонние шумы и улучшать качество звука. Еще одна функция — структурирование информации. В Sber Jazz можно создать онлайн-встречи, а затем получить полную расшифровку с разбивкой по спикерам или заметку с темами, задачами и кратким содержанием беседы. Еще одна фишка — SaluteJazz XR, метавселенная для проведения встреч и обучения: трехмерное пространство, в которое можно пригласить до 50 аватаров.

SaluteBot — чат-бот для автоматизации общения с клиентами. Подключается к сайтам, соцсетям (ВК, Одноклассники) и мессенджерам (Telegram, Viber), доскам объявлений (Авито), по итогам общения собирает информацию и может передать ее в CRM.

SaluteSpeech предназначен для синтеза и распознавания речи. Используется для автоматических обзвонов и в интерактивных голосовых меню (например, для записи к врачу по телефону или решения проблем с кредиткой). Сервис предлагает семь голосов — четыре женских и три мужских, один из которых говорит на английском языке. Также анализирует записи разговоров живых операторов с клиентами.

SaluteRPA — это роботы для автоматизации рутинных операций. Они могут проанализировать сканы документов и классифицировать их, просмотреть и изучить сайты, собрать информацию. Главные пользователи — HR и финансисты. SaluteRPA можно интегрировать с GigaChat и создать свой сценарий автоматизации процесса: например, для подготовки отчетности, поиска кандидатов на вакансии, мониторинга обращений, контроля сроков.

Российские модели генеративного ИИ: чем они могут помочь бизнесу?

Яндекс

Яндекс активно работает над различными проектами в области машинного обучения, нейронных сетей, компьютерного зрения и других технологий, участвует в научных исследованиях в области искусственного интеллекта и сотрудничает с ведущими университетами и научными центрами по всему миру.

В отличие от Сбера, который упаковал свои разработки в отдельные сервисы, Яндекс выбрал комплексный подход: компания предлагает клиентам пакетное решение — «Яндекс 360», в котором используется ИИ. Помимо этого, разработчикам доступны три созданные Яндексом продукта.

YandexGPT 3 — новая линейка «пишущих» моделей ИИ. Умеет отвечать на вопросы (например, рассказывать об условиях получения кредита), пересказывать содержание и выделять главное (например, читать отзывы о продукте и составлять список проблем), переписывать и стилизовать готовые тексты, придумывать идеи. Кроме того, YandexGPT 3 умеет искать в тексте нужную информацию и анализировать ее: скажем, нейронка может изучить и резюме и сказать, подходит человек на вакансию или нет.

YandexART рисует картинки и анимацию по текстовым запросам. Изображения и видеоэффекты получаются с досконально проработанными деталями и учитывают российский культурный контекст, поскольку в данных, на которых обучается модель, много локальных реалий. Маркетологи используют YandexART для создания рекламы, архитекторы и дизайнеры с его помощью создают декорации, костюмы, плакаты, логотипы.

Яндекс Диалоги — это один из самых известных голосовых виртуальных помощников в России — Алиса. Помимо «частного» использования Алиса может помогать бизнесу: отвечать на вопросы при заказе товаров в магазине, управлять умными пространствами — открывать шлагбаумы в ЖК, включать свет и бытовые приборы в отелях, ассистировать во время обучения или тренировок.

Российские модели генеративного ИИ: чем они могут помочь бизнесу?

МТС AI

MTS AI развивает несколько продуктов на базе компьютерного зрения, технологий обработки естественного языка и генеративного ИИ. Компания активно работает с нейросетями, микросервисной архитектурой и высоконагруженными сервисами. В распоряжении MTS AI — мощная инфраструктура, суперкомпьютер, большие данные.

TenVision — инструмент для разработки сервисов облачного видеонаблюдения и аналитики. Используется для обеспечения безопасности, например, охраны складов или ТЦ; контроля за соблюдением процессов, скажем, на кассах в магазине или на опасном производстве. В ретейле помогает анализировать трафик посетителей и загрузку по часам, распознавать эмоции клиентов.

WordPulse — сервис на базе машинного обучения, который позволяет проанализировать диалоги сотрудников с клиентами (как переписки, так и записи звонков), чтобы построить оптимальный скрипт разговора.

Audiogram — это платформа для синтеза и распознавания речи, логическое продолжение WordPulse. Используется для автоматизации работы колл-центров, озвучивания книг и компьютерных игр, создания субтитров для фильмов и видеороликов, расшифровки записей конференций и интервью.

Cotype — большая языковая модель для бизнеса, на основе которой можно создать персонального помощника для сотрудников или чат-бота для ответов на вопросы клиентов или кандидатов на вакансии. Также можно развернуть свой сервис генерации и редактирования рекламных текстов и деловых писем, ответов на обращения, подготовки отчетов и проверки документации.

Российские модели генеративного ИИ: чем они могут помочь бизнесу?

JustAI

Just AI разрабатывает платформы для создания виртуальных ассистентов, системы распознавания и синтеза речи, инструменты для анализа и понимания естественного языка, решения для интеллектуальной обработки больших массивов неструктурированных данных.

Jay Copilot представляет собой «одно окно» для доступа к разным сервисам, как ChatGPT. Он может найти в документах нужную информацию, написать письмо, текст и даже код, сгенерировать картинку, озвучить или расшифровать текст, выделить главное в аудио- или текстовых заметках, записанных на ходу. В Jay Copilot помимо собственной нейросети JustAI используется GPT, Midjourney и DALL-E – то есть западные решения, а также российские GigaChat и YandexGPT. Чтобы защитить свою информацию при передаче в зарубежные нейросети, можно подключить отдельный сервис — Jay DataGuard.

CAILA Ultimate 2.0 — публичный каталог решений и сервисов, которые можно использовать в готовом виде или на этой же платформе дообучить под свои задачи.

Conversational Platform — платформа для разработки голосовых и текстовых ботов. Поддерживает больше 25 каналов подключения — от сайтов и мессенджеров до голосовых помощников вроде Алисы.

Aimychat — логическое продолжение предыдущего продукта. Aimychat — это чат для колл-центров. Он объединяет обращения, поступающие с сайта или из соцсетей и мессенджеров, отвечает на типовые вопросы, более сложные распределяет по темам и подбирает, какому специалисту лучше направить обращение. Также он служит суфлером для операторов: во время звонков выводит на экран подсказки.

Российские модели генеративного ИИ: чем они могут помочь бизнесу?

Важно отметить, что разработчики ИИ предлагают не только облачные решения и интерфейсы доступа к сторонним моделям, но и API для создания собственных решений. Это позволяет компаниям разрабатывать более кастомизированные прикладные решения, эффективно адаптируя модели ИИ под свои задачи и требования.

Арсений Груздев
Руководитель практики Data Science ТеДо

Teamlogs

Сервис для расшифровки аудио- и видеозаписей. Работает как с русским, так и с английским языком. Заявленная точность расшифровки составляет 95%, но, конечно, зависит от качества исходной записи.

Николай Иронов

Генератор логотипов и айдентики, разработанный в студии Артемия Лебедева. Команда Лебедева первой в России коммерциализировала использование генеративного ИИ, и за четыре года ИИ создал более 3 млн логотипов.

Иронов предлагает клиентам полный дизайн-пак: от лого, фирменных цветов и паттернов до шаблонов для полиграфии и соцсетей. Николай генерирует айдентику даже на основе образов, напрямую не упомянутых в тексте. Также в него внедрена защита от повторов, то есть скачанные одними заказчиками материалы никогда не попадают в выдачу другим.

Cloud.ru

Компания предоставляет облачную инфраструктуру, платформы и сервисы для разработки и эксплуатации моделей машинного обучения. Они используют два суперкомпьютера — Christofari и Christofari Neo, а также свою собственную облачную платформу на бесплатных компонентах — ML Space. Последние обновления платформы позволяют устанавливать часть решений на серверах клиентов и выполнять вычисления в облаке, создавать модели для NLP и компьютерного зрения, а также упрощают процесс проведения экспериментов.

Кроме того, компания создала «маркетплейс» AI Services с простым подключением готовых решений через API и бесплатным демо сервисов. Среди предложений: генеративная проверка орфографии, модель для переноса лиц на изображениях и видео, модель для переписывания текстов и многое другое.

Карта провайдеров генеративного ИИ в России

Российские модели генеративного ИИ: чем они могут помочь бизнесу?

Для наглядности мы собрали возможности провайдеров в единую таблицу и добавили в нее важный для выбора ИТ-решения критерий — доступность информации о безопасности. Чтобы оценить доступность, мы прошли путем рядового пользователя: заходили на сайты провайдеров и смотрели, есть ли рядом с описанием сервисов информация об их безопасности и вариантах поставки — в облаке или на мощностях клиента.

Подробнее о безопасности решений расскажем в следующем обзоре.

Екатерина Прохорова
Дата-саентист, автор текста
Денис Ситдиков
Дата-саентист, автор текста

Описание сервисов на 3 июня 2024 года.

1414
2 комментария

Чат гпт форевер, все остальное от лукавого, скоммунизжено от него и используют его наработки

Ответить
Комментарий удалён модератором

Начали внедрять для помощи СП. В итоге пришлось отказать в пользу chatGPT. Работает слабенько, а стоит сильно дороже chatGPT

Ответить