🧠 Большие языковые модели: что это и как они меняют нашу жизнь?

🧠 Большие языковые модели: что это и как они меняют нашу жизнь?

На днях все СМИ облетела новость:Т-банк выложил свою языковую модель на 32 млрд параметров в открытый доступ!Она разработана на базе китайской Qwen-2.5 от Alibaba Group и обещает открыть бизнесу новые горизонты.

Что это значит и зачем это нужно?

Большая языковая модель (LLM)- это одно из приложений искусственного интеллекта, служащее основой для решения задач компьютерной обработки естественного языка. Благодаря заложенным в них алгоритмам искусственного интеллекта LLM могут "читать" и "понимать" тексты, написанные людьми, а также создавать свои собственные.

LLM позволяет решать такие задачи автоматизации:Умные чат-боты для поддержки клиентов.Ассистенты для сотрудников (генерация кода, отчётов, исследований).Автоматизация рутинных процессов.

"Млрд параметров" в языковой модели — количества обучаемых параметров, которые составляют основу её работы. Параметры — это числа, используемые моделью для определения связи между словами, фразами и контекстами в тексте.

Простой пример из жизни: на основе модели ЯндексGPT работает голосовой помощник Алиса, знакомый многим пользователям.

Немного цифр:Вот рейтинг крупнейших Российских языковых моделей:Cotype Nano (МТС) — 1,5 млрд параметров.GigaChat (Сбер) — 29 млрд параметров.T-Pro (Т-банк) — 32 млрд параметров.YaLM (Яндекс) — более 100 млрд параметров.

* Для сравнения, у GPT-4 от OpenAI — около 500 млрд параметров.

Много это или мало? Чем больше параметров, тем лучше модель решает сложные задачи, но она также требует огромных вычислительных ресурсов.

Почему же модель T-банк создана на базе иностранного софта?

Создание и обучение моделей требует больших финансовых затрат и вычислительных мощностей. Поэтому работа над ними доступна только крупным IT-компаниям. Существуют сотни открытых языковых моделей. Но это не самостоятельные проекты — большинство из них разработаны на базе нескольких LLM, называемых базовыми моделями (foundation models).

На картинке к посту, вы можете наглядно увидеть, как появлялись модели, по годам. Желтым выделены как раз таки открытые модели.

Юридическая сторона вопроса

Модели, особенно в банковском секторе, стали частью нашей жизни, но есть нюансы.

(1) Ответственность за результат:

Согласно ст. 721 ГК РФ, услуги должны быть качественными.

Однако многие платформы снимают с себя эту ответственность через пользовательские соглашения.

Пример: YandexGPT прямо указывает, что не гарантирует точность или корректность сгенерированного контента.

(2) Персональные данные:

Работа с LLM предполагает обработку больших массивов данных, что требует соблюдения законов о защите данных, о которых я недавно писал (например, ФЗ-152).

Большие языковые модели — это не просто хайповая технология, а мощный инструмент для автоматизации и оптимизации. Однако их внедрение требует учёта не только технических, но и юридических аспектов.

В этом ключе особенно актуальным становится обсуждаемся уже долгое время концепция федерального закона "Цифровой кодекс Российской Федерации", появление которого обещают к середине 2025 года.

А вы используете в своей работе/жизни такие модели? Пишите в комментариях!

Начать дискуссию