{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

OpenAI создала ИИ-модель для генерации выжимок из книг Статьи редакции

Сначала она делает выжимки из разделов, которые обобщает в текст.

Модель искусственного интеллекта разработана на основе GPT-3. OpenAI не планирует делать её доступной или выкладывать исходный код.

По словам исследователей, эта модель — часть постоянных исследований компании по развитию искусственного интеллекта.

Сначала модель делит книгу на разделы и делает выжимку каждого, которые объединяет ещё в несколько выжимок, пока не получится финальный текст.

В качестве примера компания приводит несколько книг — например, «Алису в Стране чудес», в которой 26 тысяч слов, модель сократила до 66 выжимок по 6 тысяч слов, затем до шести по 830 слов. В финальном пересказе осталось 136 слов.

Выжимка из «Алисы в Стране чудес», созданная моделью OpenAI

OpenAI обучил модель на художественных книгах в обучающем наборе данных GPT-3, которые содержали в среднем больше 100 тысяч слов, пишет VentureBeat.

Для оценки модели исследователи взяли 40 самых популярных книг 2020 года и поручили двум людям прочитать их и написать выжимку, а затем оценить друг друга и модель.

Модель успешно создавала тексты «на уровне книги», которые содержали большую часть информации, но иногда генерировала неточные утверждения из-за отсутствия контекста, говорят исследователи.

0
59 комментариев
Написать комментарий...
Valentin Dombrovsky
 В качестве примера компания приводит несколько книг — например, «Алису в Стране чудес», в которой 26 тысяч слов, модель сократила до 66 выжимок по 6 тысяч слов, затем до шести по 830 слов. В финальном пересказе осталось 136 слов.

И прям как в анекдоте, «такая херня получилась». 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

Ну если Вы «Алису» не читали, то да, пожалуй. И это «модельный» пример — боюсь, в других книгах будет хуже. 
Хотя, конечно, может быть, я слишком требователен к ИИ. :) 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

Так «Алису»- то читали? Какая разница, сколько книг Вы прочитали, если речь о конкретном произведении? Содержание его помните? И всё нормально в пересказе? Скажем так, школьник за него получил бы троечку с натяжкой… что, может, не так уж и плохо, конечно.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

С детства прошло много времени — возможно, Вы забыли какие-то детали…

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

Суть Алисы: девочка уснула в полдень и у неё случился наркотрип. В этом коротком отрывке, я полагаю, я всё передал. 
Тест на память: кого и за что судила Королева Червей? Чур не подглядывать. 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

Ко-ко-ко, переходы на личности и всё такое… 
Насчёт теста: ок, я понял. Тогда действительно, «суть» передана верно (так же, как и в моём комментарии). 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

Ну если Вы настолько на этом зациклились, что больше и обсуждать ничего не можете, то что я могу о Вас сказать? 
Пожалуй, лишь то, что я не рекомендую Вам к прочтению Де Квинси, Кастанеду, Хантера С. Томпсона и Ирвина Уэлша — от них Вам вообще крышу снесёт. 
Ах да, ещё можете погуглить про то, что такое «утрирование» — может пригодиться.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
56 комментариев
Раскрывать всегда