Сравнение топовых нейросетей для юриста

За развитием всех моделей не уследить, поэтому я потестировал платные подписки каждой из перечисленных моделей и подготовил для вас обзор-сравнение топовых LLM. Если что-то непонятно, буду рад ответить в комментариях.

Перед тем как сравнивать модели отмечу:

Российские LLM пока слабее зарубежных. Причины: меньше вычислительных мощностей для обучения (в страну почти не поставляют современные GPU), меньше качественных и разнообразных данных на русском и английском языках, меньше инвестиций.

Не все модели подходят для юридической работы, связанной с анализом больших объемов текста и логическими построениями. Рекомендую использовать только рассуждающие (reasoning) модели. Это, навпример, GPT-5 Thinking, Gemini 2.5. Pro, Grok 4.

Ориентируйтесь на бенчмарки (с осторожностью) для объективной оценки производительности моделей. Я писал о них подробнее здесь. Впрочем модели постоянно обновляются, поэтому лидеры в этих рейтингах могут меняться местами после каждого крупного апдейта.

Идеальной модели не существует. Сравнивать топовые модели - это примерно как сравнивать iPhone и Samsung. Выбор зависит от вкуса и конкретных задач.

Критерии выбора под юридическую практику

1. Мощность модели (параметры). Больше параметров - модель умнее и больше знает.

2. Контекстное окно - оперативная папять модели, то есть сколько информации чат может принять.

3. Функционал: какие инструменты доступны сверх чата (агентный режим, Deep Research и т.п.).

4. Конфиденциальность. У большинства топов есть режимы без обучения на пользовательских данных, но не у всех.

5. Стоимость.

6. Доступ и удобство: VPN и прочее.

Топ-модели: сильные стороны и ограничения

ChatGPT (OpenAI)

Плюсы

  • Простота старта: в GPT-5 модель сама умеет переключаться в режим рассуждения, а это меньше ручных настроек для новичков. Но юристам я советую всегда переключаться в режим Thinking.
  • Агентный режим. Агент может, например, зайти в ваш аккаунт в КонсультантПлюс и искать там судебную практику (довольно медленно).
  • Контекстное окно: до 192 000 токенов в GPT-5 Thinking, что довольно неплохо.
  • OpenAI заявлили, что в модели присутствует модуль снижения галлюцинаций. Действительно, по моему опыту модель выдумывает заметно меньше.

Минусы

  • Линейка меняется: после волнений пользователей многое вернули, но, например, GPT-4.5 исчезла.
  • PDF-капризы: иногда отказывается нормально переваривать сканы, где конкуренты справляются.

Gemini (Google)

Плюсы

  • Огромное контекстное окно - до 1 млн токенов. То есть в чат может поместиться 2-3 Налоговых кодекса.
  • Экосистема: AI Studio для продвинутой работы с расширенными настройками, Gemini с минималистичным интерфейсовм. И NotebookLM для работы с документами (до 300) с пониженным риском галлюцинаций.
  • Интеграция с Google Workspace: редактирование договоров прямо в Docs напрямую.
  • Качественная транскрибация аудио.
  • Отлично работает с русским языком.
  • Цена. Можно работать соверешенно бесплатно в AI Studio, пользуясь почти всеми возможносятми.

Минусы

  • Стабильная работа из России затруднена.
  • Не самый сильно веб-поиск (что странно для Google)/

Claude (Anthropic)

Плюсы

  • Послушность инструкциям: аккуратно следует системным правилам и требованиям пользователя.
  • Артефакты: можно быстро собирать интерактивные мини-приложения, лендинги, тесты, диаграммы прямо в интерфейсе. Можно создать за пару минут калькуляторы неустойки и подобноею
  • Фокус на приватности: повышенное внимание к защите данных.

Минусы

  • Строгие блокировки. Сервис недоступен для россиян, возможны бессрочные баны аккаунтов.
  • Лимиты: на сложных задачах намного бысрее упирается в лимиты и приходится ждать.

Grok (xAI, Илон Маск)

Плюсы

  • Сильное рассуждение (ризонинг): в аналитических задачах по юрматериалам показывает отличные результаты.
  • Очень крутой веб-поиск. Он реально находит редкие источники на задворках интернета.
  • Отсутствует цензура.

Минусы

  • Русский язык заметнее проседает, часто тянет англицизмы.
  • Цена: дороже большинства - $30 против $20 у многих конкурентов.
  • Функционал: пока беднее по дополнительным возможностям, хотя это, вероятно, вопрос времени.

DeepSeek

Плюсы

  • Без VPN.
  • Бесплатно .

Минусы

  • Конфиденциальность. Больше всего утечек и самые расплывчатые формулировки в политике конфиденциальности.
  • Перегрузка серверов. Поскольку модель халявная, то ответы часто приходится долго ждать.
  • Минимум инструментов: экосистема пока скромная.

Практические советы по выбору

Держите 2–3 модели в арсенале: одна как основная “рабочая лошадка”, вторая — для проектов с особыми требованиями (например, гигантский контекст), третья — как запасной вариант под сложные интеграции.

Для процессных документов и аналитики отдавайте приоритет reasoning-моделям с хорошей репутацией по точности и следованию инструкциям.

При работе с чувствительными документами исключайте решения с рисковой политикой данных, отключайте обучение на своих данных.

Под большие кейсы заранее планируйте лимиты и контекст.

Не полагайтесь слепо на веб-поиск модели: для судебной практики лучше двойная проверка: вручную в профильных базах и перекрестная в другой LLM.

Делюсь результатами моих экспериментов и в ТГ-канале. Подписывайтесь, там много практических инструкций.

1
Начать дискуссию