GigaChat от «Сбера» научили распознавать изображения и рукописный текст

Функция также доступна через API.

  • Пользователи GigaChat Pro теперь могут отправить изображение в качестве запроса для дополнительного контекста, рассказали в «Сбере». Например, модель сможет определить, сколько человек на фотографии, во что они одеты и прочее.

  • Кроме того, модель научилась распознавать печатный и рукописный текст, формулы, графики, таблицы и анализировать данные из них. К примеру, можно сфотографировать часть конспекта и попросить нейросеть дать краткое содержание.

  • Функция также доступна бизнес-клиентам через API. Ритейлеры могут загрузить изображение товара и попросить сервис придумать к нему продающее описание или компании могут систематизировать медиаконтент, приводит примеры использования «Сбер».

  • Модель GigaChat Pro доступна бесплатно в веб-версии, Telegram и «ВКонтакте». Для доступа ко всем функциям нужно зайти через «Сбер ID».

  • «Сбер» представил собственного чат-бота GigaChat в апреле 2023 года, а в сентябре того же года открыл доступ к нейросети для всех пользователей, представил GigaChat API для бизнеса и добавил ИИ-помощника в свой сервис SaluteBot. Чат-бота также поддерживают «умные» колонки SberBoom.

1616
36 комментариев

определить, сколько человек на фотографииСвериться с базами военкомата и отправить повестки.
Очень полезная нейросеть.

12
1

Комментарий недоступен

3
1

Комментарий недоступен

1
1

Одна нейросеть чмырит другую, киберсрач который мы заслужили

1

модель научилась распознавать печатный и рукописный текстВрачи из поликлиники смеются в лицо. Их все ещё могут распознать только провизоры в аптеке

6