Как перевести целую книгу с помощью нейросетей

Рассказываю о своем опыте.

На GitHub есть репозиторий https://github.com/hydropix/TranslateBooksWithLLMs/. Это удобный инструмент, который позволяет перевести целые книги или любые другие текстовые файлы (например, с субтитрами) с помощью современных нейросетей. Работает он в виде веб-интерфейса, справляется (теоретически) с документами любого объема — от одной страницы до романа в тысячу страниц. Позволяет переводить электронные книги и документы в форматах EPUB, SRT, DOCX, TXT с сохранением оригинального форматирования документа.

Для работы можно использовать как локальные LLM на своем компьютере (что бесплатно, но обычно медленно, если у вас не очень мощный ПК с топовыми видеокартами), так и платные облачные сервисы (например, от OpenAI, Google, OpenRouter и т.д.). Программа умеет автоматически сохранять прогресс (что очень полезно, поскольку перевод книжки обычно занимает много часов), так что можно продолжить перевод с того же места после перерыва и не переживать за его сохранность.

На моём новом MacBook я пробовал перевести детективную книжку с помощью локальной модели (LM Studio, qwen/qwen3.6-35b-a3b). Это заняло больше 12 часов, в общем бесплатно, но долго. Перевод в целом вполне читабельный, хоть и не без небольших огрехов. Но причина, конечно, в том, что qwen не самый лучший переводчик на русский, модель заточена под другие задачи. А более подходящих для перевода моделей я пока не скачал.

Потом попробовал перевести техническую книгу (про Docker и Kubernetes) используя бесплатную удаленную модель из коллекции OpenRouter (openai/gpt-oss-120b:free). Перевод занял 3 часа, качества я от этой модели не ждал и не получил (модель уже достаточно старая по нынешним временам, выпущена чуть меньше года назад). Хотя это технический текст, и с не слишком удачными оборотами можно смириться, но больше раздражало то, что в некоторых местах поехала разметка. Вообще, скорее всего для меня перевод технических книг с английского будет самой главной причиной использовать эти технологии.

Наконец я решил потестировать платную, но относительно дешёвую модель deepseek/deepseek-v4-flash. Взял книжку из вселенной Warhammer 40k, про орден Сестёр Битвы. Чтобы было аутентичнее, перед переводом я попросил модель от Qwen в обычном чате сформулировать системный промпт для того, чтобы перевод был в стиле этого сеттинга. Qwen мне предложил такой промпт (это его русский перевод, хотя я использовал английский для экономии токенов):

"Переводи в стиле хроник Адепта Сороритас вселенной Warhammer 40,000. Вызывай ощущение фанатичной веры, готического величия и неумолимого огня священной войны через выбор слов. Пусть каждое предложение звучит с литургической весомостью — где болтеры ревут, как псалмы, где доспехи сияют освящённой сталью, а сомнение выжигается пламенем очищения.

Естественно вплетай в текст архаичную, церковнославянскую и воинственную лексику: «верная», «еретик», «освящённый», «кающийся», «крестовый поход», «божественный гнев», «чистота намерений». Сохраняй латинские фразы и терминологию Империума (например, «Adepta Sororitas», «Exorcist», «Penitent Engine») без излишних пояснений — пусть они звучат как священные заклинания.

Создавай атмосферу суровой воинственности и трансцендентной преданности: Сёстры не просто сражаются — они вершат божественное правосудие. Их слова — молитвы; их деяния — писание. Передавай мрачную напряжённость между милосердием и истреблением, где сострадание проявляется через чистоту клинка, а спасение обретается в крови и ладане. Выводи только перевод, без пояснений."

Ну и результат мне понравился, все перевелось как раз в подобном стиле. Программа настроена на то, что переводит в 2 этапа, сначала выдает черновой перевод, потом пытается его улучшить.

Вот пример того, что в итоге получилось:

"В серой, пустотелой гробнице стройно звучал псалом Сестёр.

«О Император, в вере и в пламени возносим мы Тебе молитвы наши». Сестра Эстред Турга стояла на одном колене; голос её дышал пламенной верой, а Авто-Гобелен Суда Императора (прим. звучит странновато, но я тоже не знаю, как лучше перевести the Auto-Tapestry of the Emperor’s Judgement) она держала прямо перед собой. Многослойное шитьё его искрилось в свете настенных факелов, а венчавшая его кость, казалось, источала сияние. «В святейших реликвиях Твоих зрим мы благословение Твоё. Созерцаем мужество Твоё, дарованное нам, здесь, в мирах Тьмы Твоей. Видим дары битвы и крови, жизни и смерти, и пред нами – ратные подвиги последователей Твоих во всей галактике. Да придадут реликвии Твои доблести им».

Пред ней, в средоточии необъятной усыпальницы, покоился высокий саркофаг с откинутой крышкой. По обеим сторонам его возвышались три исполинских немых изваяния в полных парадных доспехах Астра Милитарум, с воздетыми к небу саблями. Клинки их сплетались в арки почета, подбородки вздернуты, каменные взоры обращены друг на друга. Стены покрывали барельефы, а всё венчал каменный свод, едва различимый во мраке факельных отблесков.

Внутри саркофага покоились истлевшие бренные останки капитана Астра Милитарум, наполовину сбереженные стужей склепа. От доспехов его остались лишь цветные пятна, а из разлагающейся плоти лица пустые глазницы бессмысленно вперялись в свод. Рядом с ним лежала реликвия, ради которой Аэстреда пересекла галактику: изящная изогнутая сабля, всё еще не ведавшая ржавчины и сияющая почти золотым блеском. Гарда её была выкована в виде ниспадающих крыльев, а на изогнутом клинке кислотой было вытравлено посвящение: 22-й Атаниан. Избранные Святой."

Перевод книжки размером 1,3 Мб в формате epub занял около 4 часов и съел токенов примерно на $0,5, притом что в самом веб-интерфейсе программы-переводчика сумма в долларах показывалась отчего-то раза в четыре больше. Впрочем даже когда я пользовался бесплатной моделью, веб-интерфейс мне писал какую-то сумму в долларах, по всей видимости эта часть интерфейса недоотлажена.

В общем, профессия переводчика книг, наряду с огромным количеством других профессий, в ближайшем будущем отомрет, как это ни печально. Конкурировать человеку с ИИ переводом книги за 50 центов очень сложно. Программисты тоже уже никогда не будут прежними. В последние месяцы я активно вожусь с ИИ-агентами для программирования и абсолютно понятно, что сейчас без ИИ программировать уже бессмысленно. Пока что и без живого программиста не получится создать хороший продукт, потому что агентом надо активно рулить, но сейчас все очень быстро меняется. Музыканты тоже сильно боятся конкуренции от Suno, мир меняется...

Начать дискуссию