GPT — восторгаться нельзя хейтить

Из диалога с YandexGPT
Из диалога с YandexGPT

Дурац... абсурдный запрос ("стоп-кран в душе") к текстовой нейросети Яндекса навеян публикацией "YandexGPT тоже провалил тест на ручник". Ну, публикация и публикация: начало интересное, потом становится скучнее. А вот комментарии заставляют задуматься о том, что всё не так однозначно.

Для справки:

Что такое GPT?

Генеративные предобученные трансформеры, широко известные как GPT, представляют собой семейство моделей нейронных сетей, использующих архитектуру трансформеров и являющихся ключевым достижением в области искусственного интеллекта, с помощью которого работают генеративные приложения ИИ, такие как ChatGPT. Модели GPT дают приложениям возможность генерировать текст и контент (изображения, музыку и многое другое), похожий на созданный человеком, и отвечать на вопросы в разговорной манере. Организации из разных отраслей используют модели GPT и генеративный искусственный интеллект для ботов вопросов и ответов, краткого изложения текста, генерации контента и поиска.

Источник

Обратите внимание: GPT — это модели языкового прогнозирования. Они предсказывают наилучший возможный ответ, основываясь на своем понимании языка.

...модели GPT полагаются на знания, полученные после обучения работе с сотнями миллиардов параметров в огромных наборах языковых данных. Они могут учитывать контекст ввода и динамически обрабатывать различные части входных данных, чтобы генерировать длинные ответы, а не просто следующее слово в последовательности. Например, если попросить создать фрагмент контента, основанного на творчестве Шекспира, модель GPT делает это, запоминая и восстанавливая новые фразы и целые предложения с похожим литературным стилем.

Всё тот же источник

Даже если вы не используете джипити, а только читаете о нём, вы наверняка осознаете мощь и перспективы этого инструмента. Но вместе с тем постоянно пополняются и коллекции смешных ответов нейросетей. Конечно, они (нейросети) быстро учатся, буквально на лету исправляя ответы, но спрашивается, почему публике предоставили сырой инструмент, частенько выдающий разной степени несуразицу?

Один ответ очевиден: для дальнейшего обучения.

Варианты оценки пользователем ответа YandexGPT
Варианты оценки пользователем ответа YandexGPT

Другой ответ: речь (человека) слишком сложна для машин, во всяком случае, пока. Да, что-то они могут, а кое-что даже неплохо, но тем не менее существенные ограничения есть и вряд ли исчезнут в обозримом будущем.

Какого цвета стоп-кран в самолете?

Вариант 1
Вариант 1
Вариант 2
Вариант 2

А это что?

Вариант 3
Вариант 3
Стоп-кран в самолете есть, но не для всех!
Стоп-кран в самолете есть, но не для всех!

То есть для правильного ответа на вопрос необходимо не только понимать значение слова ("стоп-кран — кран экстренного торможения"), но и обладать специфическими знаниями (так, пассажиры знают о стоп-кране в поезде, но вряд ли подозревают о таковом в самолете). При этом вряд ли кто-то из людей совершит ошибку относительно стоп-крана в душевой.

О важности контекста

Контекст — совокупность фактов и обстоятельств, в окружении которых происходит какое-либо событие, существует какое-либо явление, какой-либо объект.

Одно и то же слово может иметь разный смысл, будучи помещённым в разный контекст.

*Напомню о семантическом (семиотическом) треугольнике и его модификации — четырехугольнике.

1.

Семантический треугольник
Семантический треугольник

2.

Расширенный семиотический треугольник
Расширенный семиотический треугольник

3.

Семантический четырехугольник
Семантический четырехугольник

...несмотря на то, что одним из базовых требований к термину является его однозначность, определенная теория по-своему опосредует систему понятий того или иного дисциплинарного контекста. В языковом воплощении (например, будучи зафиксированным в словарях или глоссариях) термин вполне может быть многозначным, учитывая обилие теорий согласно одного и того же понятия. В связи с этим, по нашему мнению, недостаточно одной посвященности реципиента в особенности терминосистемы дисциплинарного контекста. Продуцент должен обеспечить определенный локальный контекст, чтобы его интерпретация понятий была эффективно воспринята. Именно сфера функционирования термина, т. е. текст/речь/дискурс, позволяет говорить о его однозначности, в частности непосредственный контекст его использования.

*Эта прелестная цитата — для любителей сложных текстов.

...хотя одним из основных требований к термину является его точность, некоторые теории могут по-разному объяснять систему понятий в определенной научной области. В языке (например, в словарях и глоссариях), термин может иметь несколько значений, так как существует множество теорий, объясняющих одно и то же понятие. В связи с этим, на наш взгляд, недостаточно того, чтобы читатель понимал особенности терминологии в определенной научной сфере. Автор должен обеспечить конкретный контекст, чтобы облегчить понимание и восприятие его идей. Именно область использования термина, то есть текст или речь, определяет его точное значение. Контекст, в котором термин используется, также играет ключевую роль в определении его точного значения.

А это YandexGPT пересказал цитату "своими словами"

**Здесь должна быть связка между вышележащим текстом и выводами, но я не могу пока придумать ничего подходящего.

Выводы:

1) учитывая определённую сложность связей объект-термин-смысл-контекст, не стоит ждать чуда от нейросетей/ИИ, особенно в области языка и особенно в ближайшем будущем;

2) на зеркало неча пенять, коли рожа крива (если вам не нравятся тексты от нейросетей, вспомните, на каких данных они обучаются).

P.S. Всё вышесказанное не касается создателей "типичного" веб-контента, который решает типовые задачи лидогенерации и монетизации.

UPD: Похоже, Гугл таки продвигается в понимании интента пользователя. Методы не новы, просто от теории переходят/перешли к практике. Публикация почти двухлетней давности, но интересна в контексте проблемы диалога человека и нейросети.

2
1 комментарий