GPT — восторгаться нельзя хейтить
Дурац... абсурдный запрос ("стоп-кран в душе") к текстовой нейросети Яндекса навеян публикацией "YandexGPT тоже провалил тест на ручник". Ну, публикация и публикация: начало интересное, потом становится скучнее. А вот комментарии заставляют задуматься о том, что всё не так однозначно.
Для справки:
Что такое GPT?
Генеративные предобученные трансформеры, широко известные как GPT, представляют собой семейство моделей нейронных сетей, использующих архитектуру трансформеров и являющихся ключевым достижением в области искусственного интеллекта, с помощью которого работают генеративные приложения ИИ, такие как ChatGPT. Модели GPT дают приложениям возможность генерировать текст и контент (изображения, музыку и многое другое), похожий на созданный человеком, и отвечать на вопросы в разговорной манере. Организации из разных отраслей используют модели GPT и генеративный искусственный интеллект для ботов вопросов и ответов, краткого изложения текста, генерации контента и поиска.
Обратите внимание: GPT — это модели языкового прогнозирования. Они предсказывают наилучший возможный ответ, основываясь на своем понимании языка.
...модели GPT полагаются на знания, полученные после обучения работе с сотнями миллиардов параметров в огромных наборах языковых данных. Они могут учитывать контекст ввода и динамически обрабатывать различные части входных данных, чтобы генерировать длинные ответы, а не просто следующее слово в последовательности. Например, если попросить создать фрагмент контента, основанного на творчестве Шекспира, модель GPT делает это, запоминая и восстанавливая новые фразы и целые предложения с похожим литературным стилем.
Даже если вы не используете джипити, а только читаете о нём, вы наверняка осознаете мощь и перспективы этого инструмента. Но вместе с тем постоянно пополняются и коллекции смешных ответов нейросетей. Конечно, они (нейросети) быстро учатся, буквально на лету исправляя ответы, но спрашивается, почему публике предоставили сырой инструмент, частенько выдающий разной степени несуразицу?
Один ответ очевиден: для дальнейшего обучения.
Другой ответ: речь (человека) слишком сложна для машин, во всяком случае, пока. Да, что-то они могут, а кое-что даже неплохо, но тем не менее существенные ограничения есть и вряд ли исчезнут в обозримом будущем.
Какого цвета стоп-кран в самолете?
А это что?
То есть для правильного ответа на вопрос необходимо не только понимать значение слова ("стоп-кран — кран экстренного торможения"), но и обладать специфическими знаниями (так, пассажиры знают о стоп-кране в поезде, но вряд ли подозревают о таковом в самолете). При этом вряд ли кто-то из людей совершит ошибку относительно стоп-крана в душевой.
О важности контекста
Контекст — совокупность фактов и обстоятельств, в окружении которых происходит какое-либо событие, существует какое-либо явление, какой-либо объект.
Одно и то же слово может иметь разный смысл, будучи помещённым в разный контекст.
*Напомню о семантическом (семиотическом) треугольнике и его модификации — четырехугольнике.
1.
2.
3.
...несмотря на то, что одним из базовых требований к термину является его однозначность, определенная теория по-своему опосредует систему понятий того или иного дисциплинарного контекста. В языковом воплощении (например, будучи зафиксированным в словарях или глоссариях) термин вполне может быть многозначным, учитывая обилие теорий согласно одного и того же понятия. В связи с этим, по нашему мнению, недостаточно одной посвященности реципиента в особенности терминосистемы дисциплинарного контекста. Продуцент должен обеспечить определенный локальный контекст, чтобы его интерпретация понятий была эффективно воспринята. Именно сфера функционирования термина, т. е. текст/речь/дискурс, позволяет говорить о его однозначности, в частности непосредственный контекст его использования.
*Эта прелестная цитата — для любителей сложных текстов.
...хотя одним из основных требований к термину является его точность, некоторые теории могут по-разному объяснять систему понятий в определенной научной области. В языке (например, в словарях и глоссариях), термин может иметь несколько значений, так как существует множество теорий, объясняющих одно и то же понятие. В связи с этим, на наш взгляд, недостаточно того, чтобы читатель понимал особенности терминологии в определенной научной сфере. Автор должен обеспечить конкретный контекст, чтобы облегчить понимание и восприятие его идей. Именно область использования термина, то есть текст или речь, определяет его точное значение. Контекст, в котором термин используется, также играет ключевую роль в определении его точного значения.
**Здесь должна быть связка между вышележащим текстом и выводами, но я не могу пока придумать ничего подходящего.
Выводы:
1) учитывая определённую сложность связей объект-термин-смысл-контекст, не стоит ждать чуда от нейросетей/ИИ, особенно в области языка и особенно в ближайшем будущем;
2) на зеркало неча пенять, коли рожа крива (если вам не нравятся тексты от нейросетей, вспомните, на каких данных они обучаются).
P.S. Всё вышесказанное не касается создателей "типичного" веб-контента, который решает типовые задачи лидогенерации и монетизации.
UPD: Похоже, Гугл таки продвигается в понимании интента пользователя. Методы не новы, просто от теории переходят/перешли к практике. Публикация почти двухлетней давности, но интересна в контексте проблемы диалога человека и нейросети.