{"id":14275,"url":"\/distributions\/14275\/click?bit=1&hash=bccbaeb320d3784aa2d1badbee38ca8d11406e8938daaca7e74be177682eb28b","title":"\u041d\u0430 \u0447\u0451\u043c \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043f\u0440\u043e\u0444\u0435\u0441\u0441\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u043f\u0440\u043e\u0434\u0430\u0432\u0446\u044b \u0430\u0432\u0442\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f72066c6-8459-501b-aea6-770cd3ac60a6"}

OpenAI создала ИИ-модель для генерации выжимок из книг Статьи редакции

Сначала она делает выжимки из разделов, которые обобщает в текст.

Модель искусственного интеллекта разработана на основе GPT-3. OpenAI не планирует делать её доступной или выкладывать исходный код.

По словам исследователей, эта модель — часть постоянных исследований компании по развитию искусственного интеллекта.

Сначала модель делит книгу на разделы и делает выжимку каждого, которые объединяет ещё в несколько выжимок, пока не получится финальный текст.

В качестве примера компания приводит несколько книг — например, «Алису в Стране чудес», в которой 26 тысяч слов, модель сократила до 66 выжимок по 6 тысяч слов, затем до шести по 830 слов. В финальном пересказе осталось 136 слов.

Выжимка из «Алисы в Стране чудес», созданная моделью OpenAI

OpenAI обучил модель на художественных книгах в обучающем наборе данных GPT-3, которые содержали в среднем больше 100 тысяч слов, пишет VentureBeat.

Для оценки модели исследователи взяли 40 самых популярных книг 2020 года и поручили двум людям прочитать их и написать выжимку, а затем оценить друг друга и модель.

Модель успешно создавала тексты «на уровне книги», которые содержали большую часть информации, но иногда генерировала неточные утверждения из-за отсутствия контекста, говорят исследователи.

0
59 комментариев
Написать комментарий...
Valentin Dombrovsky
 В качестве примера компания приводит несколько книг — например, «Алису в Стране чудес», в которой 26 тысяч слов, модель сократила до 66 выжимок по 6 тысяч слов, затем до шести по 830 слов. В финальном пересказе осталось 136 слов.

И прям как в анекдоте, «такая херня получилась». 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

Ну если Вы «Алису» не читали, то да, пожалуй. И это «модельный» пример — боюсь, в других книгах будет хуже. 
Хотя, конечно, может быть, я слишком требователен к ИИ. :) 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Valentin Dombrovsky

Так «Алису»- то читали? Какая разница, сколько книг Вы прочитали, если речь о конкретном произведении? Содержание его помните? И всё нормально в пересказе? Скажем так, школьник за него получил бы троечку с натяжкой… что, может, не так уж и плохо, конечно.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Дмитрий Милюков

По тому, как вы пишете, видно, что вы читали. Много.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
56 комментариев
Раскрывать всегда