5 основных отличий GPT-4 от предыдущих версий

Новая модель искусственного интеллекта GPT-4 от OpenAI дебютировала и уже поддерживает все, от виртуального волонтера для слабовидящих до улучшенного бота для изучения языка в Duolingo. Но что отличает GPT-4 от предыдущих версий, таких как ChatGPT и GPT-3.5? Вот пять самых больших различий между этими популярными системами.

Источник <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftechcrunch.com%2F2023%2F03%2F14%2F5-ways-gpt-4-outsmarts-chatgpt%2F&postId=635010" rel="nofollow noreferrer noopener" target="_blank">TechCrunch</a>

Наиболее заметным изменением в этой универсальной системе машинного обучения является то, что она является «мультимодальной», что означает, что она может понимать более одной «модальности» информации. ChatGPT и GPT-3 были ограничены текстом: они могли читать и писать, но не более того (хотя для многих приложений этого было более чем достаточно).

Однако GPT-4 может получать изображения и обрабатывать их для поиска соответствующей информации. Конечно, вы можете просто попросить его описать, что изображено на картинке, но, что более важно, его понимание выходит за рамки этого. Пример, предоставленный OpenAI, на самом деле объясняет шутку изображением уморительно большого разъема для iPhone, но партнерство с Be My Eyes, приложением, используемым слепыми и слабовидящими людьми, позволяющее добровольцам описывать, что видит их телефон.

В видео для Be My Eyes GPT-4 описывает рисунок на платье, определяет растение, объясняет, как добраться до определенной машины в спортзале, переводит этикетку (и предлагает рецепт), читает карту и выполняет ряд других задач, которые показывают, что он действительно получает то, что изображено на изображении — если ему задают правильные вопросы. Он знает, как выглядит платье, но может не знать, подходит ли оно для вашего интервью.

Несмотря на все то, что сегодняшние чат-боты делают правильно, их, как правило, легко сбить с пути. Небольшие уговоры могут убедить их, что они просто объясняют, что сделал бы «плохой ИИ», или какую-то другую маленькую выдумку, которая позволяет модели говорить всевозможные странные и откровенно нервирующие вещи.

GPT-4, с другой стороны, был обучен множеству вредоносных подсказок, которые пользователи любезно давали OpenAI в течение последних года или двух. Имея это в виду, новая модель намного лучше своих предшественников по "фактичности и управляемости".

Как описывает это OpenAI, GPT-3.5 (на котором работает ChatGPT) был «тестовым прогоном» новой обучающей архитектуры, и они применили полученные уроки к новой версии, которая была «беспрецедентно стабильной». Они также смогли лучше предсказать его возможности, что снижает количество сюрпризов.

Эти большие языковые модели обучаются на миллионах веб-страниц, книг и других текстовых данных, но когда они на самом деле разговаривают с пользователем, существует ограничение на то, сколько они могут держать «в памяти». Это ограничение с GPT-3.5 и старой версией ChatGPT составляло 4096 «токенов», что составляет около 8000 слов или примерно от четырех до пяти страниц книги.

GPT-4 имеет максимальное количество токенов 32 768 — это 2 ^ 15, если вам интересно, почему число выглядит знакомым. Это составляет около 64 000 слов или 50 страниц текста, что достаточно для всей пьесы или рассказа.

Это означает, что в разговоре или при создании текста он сможет помнить до 50 страниц или около того. Таким образом, он будет помнить, о чем вы говорили 20 страниц чата назад, или при написании рассказа или эссе может ссылаться на события, которые произошли 35 страниц назад. Это очень приблизительное описание того, как работает механизм внимания и счетчик токенов, но общая идея заключается в расширенной памяти и связанных с ней возможностях.

В мире ИИ преобладают носители английского языка, и все, от данных до тестирования и научных работ, написано на этом языке. Но, конечно же, возможности больших языковых моделей применимы к любому письменному языку и должны быть доступны для них.

GPT-4 делает шаг к этому, демонстрируя, что он может с высокой точностью отвечать на тысячи вопросов с несколькими вариантами ответов на 26 языках, от итальянского до украинского и корейского. Он лучше всего подходит для романских и германских языков, но хорошо обобщается и для других.

Первоначальное тестирование языковых возможностей является многообещающим, но далеко не полным охватом многоязычных возможностей; критерии тестирования изначально были переведены с английского, а вопросы с несколькими вариантами ответов на самом деле не представляют собой обычную речь. Но он отлично справился с чем-то, для чего он не был специально обучен, что говорит о том, что GPT-4 может быть гораздо более дружелюбным к людям, не говорящим по-английски.

«Управляемость» — интересная концепция ИИ, относящаяся к их способности изменять свое поведение по требованию. Это может быть полезно, например, когда вы берете на себя роль сочувствующего слушателя, или опасно, например, когда люди убеждают модель в том, что она злая или депрессивная.

GPT-4 интегрирует управляемость более естественно, чем GPT-3.5, и пользователи смогут изменить «классическую индивидуальность ChatGPT с фиксированной детализацией, тоном и стилем» на что-то более подходящее для их нужд. «В пределах допустимого», — быстро отмечает команда, указывая на то, что это самый простой способ заставить модель сломать характер.

Это можно сделать, отправив чат-боту такие сообщения, как «Представь, что ты DM в настольной ролевой игре» или «Отвечай так, как будто ты человек, у которого берут интервью для кабельных новостей». Но на самом деле вы просто предлагали «по умолчанию» индивидуальность GPT-3.5. Теперь разработчики смогут с самого начала запекать перспективу, разговорный стиль, тон или метод взаимодействия.

Между GPT-4 и его предшественниками гораздо больше различий, в основном более тонких или технических, чем эти. Несомненно, мы узнаем гораздо больше по мере того, как пройдут месяцы, и пользователи опробуют новейшую языковую модель.

#нейросети #chatgpt #будущее #технологии #microsoft #ии

5 основных отличий GPT-4 от предыдущих версий

1. GPT-4 может видеть и понимать изображения

2. GPT-4 сложнее обмануть

3. GPT-4 имеет большую память

4. GPT-4 более мультиязычный

5. У GPT-4 разные «лица»