Зачем QA писать промпты на английском?
Вступление
В предыдущем посте я упомянул, что промпты на английском языке обычно занимают меньше токенов, чем на русском.
Но насколько велика эта разница? Стоит ли вообще писать промпты на английском? И что это даёт QA-инженерам?
Особенно если вы активно используете ChatGPT, Claude, Grok, Gemini или другие LLM в работе, то могли замечать, что один и тот же промпт на английском часто занимает меньше токенов, чем на русском.
При этом важно понимать, что экономия токенов актуальна как для обычных чатботов, так и при работе через API. В чатботах она влияет на длину доступного контекста и скорость ответов, а при использовании API — ещё и на прямую стоимость запросов.
Отсюда возникает логичный вопрос: стоит ли QA-инженерам переходить на английский в промптах, чтобы экономить деньги и контекст? Вместо общих рассуждений я решил проверить это на реальных примерах из QA-практики.
Зачем QA вообще об этом думать?
Токены — это ограниченный ресурс, который напрямую влияет на:
- стоимость использования API;
- размер доступного контекстного окна;
- объём данных, который можно передать модели за один запрос;
- эффективность работы AI-агентов.
QA-инженеры регулярно работают с большими объёмами информации:
- требованиями и user story;
- acceptance criteria;
- логами автотестов;
- stack trace;
- API-схемами;
- тест-кейсами;
- историей взаимодействия с агентами.
Если часть контекста расходуется неэффективно, то для полезных данных остаётся меньше места.
Эксперимент
Я взял несколько типичных QA-сценариев, подготовил русский и английский варианты промптов с одинаковым смыслом и посчитал количество токенов через OpenAI Tokenizer.
Для расчёта использовалась следующая формула:
Экономия (%) = (RU − EN) / RU × 100%
Под экономией понимается уменьшение числа токенов относительно русскоязычного варианта.
Пример 1. Короткий вопрос
Русский: «Заменят ли ИИ тестировщиков?» — 10 токенов
Английский: «Will AI replace testers?» — 5 токенов
Экономия — 50%. В абсолютных цифрах — всего 5 токенов. Для разового вопроса практически незаметно.
Пример 2. User Story
Русский: «Как пользователь интернет-магазина, я хочу иметь возможность восстановить пароль через электронную почту, чтобы получить доступ к своему аккаунту в случае его утраты. Критерии приемки: пользователь получает письмо; ссылка действует 30 минут; старый пароль становится недействительным; после смены пароля все активные сессии завершаются.» — 72 токена
Английский: «As an online store user, I want to reset my password via email so that I can regain access to my account if I lose it. Acceptance criteria: the user receives an email; the link is valid for 30 minutes; the previous password becomes invalid; all active sessions are terminated after password reset.» — 61 токен
Экономия — 15,3%. Такие промпты часто используются для генерации тест-кейсов.
Пример 3. Анализ логов автотестов
Русский: «Проанализируй следующие логи падения автотестов. Определи root cause. Сгруппируй ошибки. Предложи возможные исправления. Используй информацию из OpenAPI спецификации. Сформируй итоговый отчёт. Тестовая среда: pytest, Playwright, FastAPI, PostgreSQL, Docker, GitLab CI. Логи: AssertionError, TimeoutError, Connection refused, Locator not found.» — 93 токена
Английский: «Analyze the following failed test logs. Determine the root cause. Group similar failures. Suggest possible fixes. Use information from the OpenAPI specification. Generate a final report. Test environment: pytest, Playwright, FastAPI, PostgreSQL, Docker, GitLab CI. Logs: AssertionError, TimeoutError, Connection refused, Locator not found.» — 67 токенов
Экономия — 28%. Здесь разница уже заметна, особенно при работе с длинными логами.
Когда английский действительно полезен QA?
Переход на английский имеет смысл в сценариях:
- анализ больших логов и RCA,
- работа с объёмными требованиями,
- генерация тестов по документации,
- использование кодинг-агентов,
- RAG-системы,
- массовые запросы через API,
- длинные диалоги с агентами.
В коротких разовых вопросах и когда ответ нужен именно на русском — переводить промпт чаще всего не стоит.
Вывод
Полностью отказываться от русского не нужно. Но понимание влияния языка на расход токенов уже становится полезным практическим навыком QA-инженера в 2026 году.
В экспериментах экономия составила от 15% до 28%, а в коротком вопросе достигла 50%. Это уже заметная величина, особенно при регулярной работе с AI. Токены — это ресурс. Чем лучше мы умеем им управлять, тем эффективнее используем современные инструменты в тестировании.
Источники
- Токены в нейросетях: что это и как считать стоимость — хороший обзор токенов и ценообразования на русском языке
- OpenAI Tokenizer — официальный инструмент для проверки количества токенов в реальном времени
- OpenAI Cookbook: How to count tokens with tiktoken — подробное руководство по подсчёту токенов
- Neural Machine Translation of Rare Words with Subword Units (BPE) — оригинальная научная статья, в которой был предложен алгоритм Byte Pair Encoding
Дополнительно:
- SentencePiece: A simple and language independent subword tokenizer — статья о популярном универсальном токенизаторе, независимом от языка
Если тема AI в тестировании вам близка — подписывайтесь на ModernQA в Telegram. Там я разбираюсь в LLM, AI QA, тестировании AI-приложений, кодинг-агентах и современных инструментах.