Как перевести целую книгу с помощью нейросетей
Рассказываю о своем опыте.
На GitHub есть репозиторий https://github.com/hydropix/TranslateBooksWithLLMs/. Это удобный инструмент, который позволяет перевести целые книги или любые другие текстовые файлы (например, с субтитрами) с помощью современных нейросетей. Работает он в виде веб-интерфейса, справляется (теоретически) с документами любого объема — от одной страницы до романа в тысячу страниц. Позволяет переводить электронные книги и документы в форматах EPUB, SRT, DOCX, TXT с сохранением оригинального форматирования документа.
Для работы можно использовать как локальные LLM на своем компьютере (что бесплатно, но обычно медленно, если у вас не очень мощный ПК с топовыми видеокартами), так и платные облачные сервисы (например, от OpenAI, Google, OpenRouter и т.д.). Программа умеет автоматически сохранять прогресс (что очень полезно, поскольку перевод книжки обычно занимает много часов), так что можно продолжить перевод с того же места после перерыва и не переживать за его сохранность.
На моём новом MacBook я пробовал перевести детективную книжку с помощью локальной модели (LM Studio, qwen/qwen3.6-35b-a3b). Это заняло больше 12 часов, в общем бесплатно, но долго. Перевод в целом вполне читабельный, хоть и не без небольших огрехов. Но причина, конечно, в том, что qwen не самый лучший переводчик на русский, модель заточена под другие задачи. А более подходящих для перевода моделей я пока не скачал.
Потом попробовал перевести техническую книгу (про Docker и Kubernetes) используя бесплатную удаленную модель из коллекции OpenRouter (openai/gpt-oss-120b:free). Перевод занял 3 часа, качества я от этой модели не ждал и не получил (модель уже достаточно старая по нынешним временам, выпущена чуть меньше года назад). Хотя это технический текст, и с не слишком удачными оборотами можно смириться, но больше раздражало то, что в некоторых местах поехала разметка. Вообще, скорее всего для меня перевод технических книг с английского будет самой главной причиной использовать эти технологии.
Наконец я решил потестировать платную, но относительно дешёвую модель deepseek/deepseek-v4-flash. Взял книжку из вселенной Warhammer 40k, про орден Сестёр Битвы. Чтобы было аутентичнее, перед переводом я попросил модель от Qwen в обычном чате сформулировать системный промпт для того, чтобы перевод был в стиле этого сеттинга. Qwen мне предложил такой промпт (это его русский перевод, хотя я использовал английский для экономии токенов):
"Переводи в стиле хроник Адепта Сороритас вселенной Warhammer 40,000. Вызывай ощущение фанатичной веры, готического величия и неумолимого огня священной войны через выбор слов. Пусть каждое предложение звучит с литургической весомостью — где болтеры ревут, как псалмы, где доспехи сияют освящённой сталью, а сомнение выжигается пламенем очищения.
Естественно вплетай в текст архаичную, церковнославянскую и воинственную лексику: «верная», «еретик», «освящённый», «кающийся», «крестовый поход», «божественный гнев», «чистота намерений». Сохраняй латинские фразы и терминологию Империума (например, «Adepta Sororitas», «Exorcist», «Penitent Engine») без излишних пояснений — пусть они звучат как священные заклинания.
Создавай атмосферу суровой воинственности и трансцендентной преданности: Сёстры не просто сражаются — они вершат божественное правосудие. Их слова — молитвы; их деяния — писание. Передавай мрачную напряжённость между милосердием и истреблением, где сострадание проявляется через чистоту клинка, а спасение обретается в крови и ладане. Выводи только перевод, без пояснений."
Ну и результат мне понравился, все перевелось как раз в подобном стиле. Программа настроена на то, что переводит в 2 этапа, сначала выдает черновой перевод, потом пытается его улучшить.
Вот пример того, что в итоге получилось:
"В серой, пустотелой гробнице стройно звучал псалом Сестёр.
«О Император, в вере и в пламени возносим мы Тебе молитвы наши». Сестра Эстред Турга стояла на одном колене; голос её дышал пламенной верой, а Авто-Гобелен Суда Императора (прим. звучит странновато, но я тоже не знаю, как лучше перевести the Auto-Tapestry of the Emperor’s Judgement) она держала прямо перед собой. Многослойное шитьё его искрилось в свете настенных факелов, а венчавшая его кость, казалось, источала сияние. «В святейших реликвиях Твоих зрим мы благословение Твоё. Созерцаем мужество Твоё, дарованное нам, здесь, в мирах Тьмы Твоей. Видим дары битвы и крови, жизни и смерти, и пред нами – ратные подвиги последователей Твоих во всей галактике. Да придадут реликвии Твои доблести им».
Пред ней, в средоточии необъятной усыпальницы, покоился высокий саркофаг с откинутой крышкой. По обеим сторонам его возвышались три исполинских немых изваяния в полных парадных доспехах Астра Милитарум, с воздетыми к небу саблями. Клинки их сплетались в арки почета, подбородки вздернуты, каменные взоры обращены друг на друга. Стены покрывали барельефы, а всё венчал каменный свод, едва различимый во мраке факельных отблесков.
Внутри саркофага покоились истлевшие бренные останки капитана Астра Милитарум, наполовину сбереженные стужей склепа. От доспехов его остались лишь цветные пятна, а из разлагающейся плоти лица пустые глазницы бессмысленно вперялись в свод. Рядом с ним лежала реликвия, ради которой Аэстреда пересекла галактику: изящная изогнутая сабля, всё еще не ведавшая ржавчины и сияющая почти золотым блеском. Гарда её была выкована в виде ниспадающих крыльев, а на изогнутом клинке кислотой было вытравлено посвящение: 22-й Атаниан. Избранные Святой."
Перевод книжки размером 1,3 Мб в формате epub занял около 4 часов и съел токенов примерно на $0,5, притом что в самом веб-интерфейсе программы-переводчика сумма в долларах показывалась отчего-то раза в четыре больше. Впрочем даже когда я пользовался бесплатной моделью, веб-интерфейс мне писал какую-то сумму в долларах, по всей видимости эта часть интерфейса недоотлажена.
В общем, профессия переводчика книг, наряду с огромным количеством других профессий, в ближайшем будущем отомрет, как это ни печально. Конкурировать человеку с ИИ переводом книги за 50 центов очень сложно. Программисты тоже уже никогда не будут прежними. В последние месяцы я активно вожусь с ИИ-агентами для программирования и абсолютно понятно, что сейчас без ИИ программировать уже бессмысленно. Пока что и без живого программиста не получится создать хороший продукт, потому что агентом надо активно рулить, но сейчас все очень быстро меняется. Музыканты тоже сильно боятся конкуренции от Suno, мир меняется...