BlueNoroff взламывает крипто-компанию за 5 минут через дипфейк-звонок: разбор атаки изнутри + ИНТЕРАКТИВ

Встреча в Zoom. На экране — знакомое лицо инвестора, голос совпадает, акцент тот же. Через три минуты сотрудник кликает по ссылке в чате. Ещё через две — на машине работает RAT. Полный цикл компрометации: менее пяти минут. 
Встреча в Zoom. На экране — знакомое лицо инвестора, голос совпадает, акцент тот же. Через три минуты сотрудник кликает по ссылке в чате. Ещё через две — на машине работает RAT. Полный цикл компрометации: менее пяти минут. 

Как BlueNoroff строит атаку: от Telegram до полного контроля над машиной

BlueNoroff — APT-группировка, связанная с Северной Кореей, — давно специализируется на крипто-секторе. Но то, что Rescana задокументировала в апреле 2026-го, качественно отличается от предыдущих кампаний.

Цепочка атаки выглядит так:

  1. Первый контакт — спирфишинг через Telegram или email. Атакующий притворяется известным инвестором или партнёром по блокчейн-проекту.
  2. Приглашение на встречу — жертва получает ссылку через Calendly или Google Meet. Ссылка ведёт на тайпсквоттинговый домен — например, zoom-meeting[.]io вместо zoom.us.
  3. Дипфейк в реальном времени — на встрече появляется синтезированный аватар с голосом и лицом реального человека. Используются вокодерные модели для речи и GAN/диффузионные модели для лица.
  4. Малварь (вредоносное программное обеспечение) — под видом «файла презентации» или «обновления плагина» жертва запускает macOS-троян.
  5. Персистенс (устойчивость соединения) — атакующие удерживают доступ в среднем 66 дней до обнаружения.

По данным Rescana, за последние месяцы скомпрометировано более 100 организаций в 20 странах. США, Сингапур и Великобритания — в топе по числу жертв. 80% пострадавших работают в крипто/блокчейн-финансах, 45% жертв — C-level или основатели.

Что делает атаку особенно опасной — модульная архитектура малваря. RAT, стилер учётных данных и механизм персистенса существуют как отдельные компоненты. Это затрудняет сигнатурное обнаружение: каждый модуль по отдельности может не триггерить EDR.

Почему дипфейк в реальном времени — это другой класс угрозы

Важно разделить два сценария, которые часто путают.

Сценарий А — заранее смонтированное видео или аудио. Его можно проверить постфактум: артефакты сжатия, несоответствие частоты кадров, аномалии в спектрограмме голоса. Именно с такими материалами обычно работает форензика.

Сценарий Б — дипфейк в реальном времени, как в атаках BlueNoroff. Здесь нет файла для анализа. Есть только живой поток, который человек воспринимает в условиях психологического давления — деловая встреча, дедлайн, авторитетный собеседник.

По факту, второй сценарий сложнее детектировать именно потому, что он эксплуатирует не техническую уязвимость, а когнитивную. Человек не думает «проверить подлинность» в момент, когда видит знакомое лицо и слышит знакомый голос.

Технические маркеры, которые всё же можно заметить при внимательном наблюдении:

  • Задержка синхронизации губ — даже лучшие real-time модели дают лаг 80–150 мс при нестабильном соединении
  • Аномалии при быстрых поворотах головы — диффузионные модели теряют качество на резких движениях
  • Артефакты на границе волос и фона — особенно заметны при смене освещения
  • Монотонность микромимики — синтезированные лица реже моргают и почти не демонстрируют асимметричные выражения

Но рассчитывать на то, что сотрудник заметит эти детали в реальном времени — наивно. Нужны процедурные барьеры, а не только перцептивные.

AI-фрод в e-commerce: когда бот ведёт себя лучше человека

Параллельно с таргетированными APT-атаками растёт другой тип угрозы — массовый AI-фрод в электронной коммерции. Здесь нет дипфейков, зато есть синтетические поведенческие профили, которые обходят классические антифрод-системы.

Как это работает на практике:

  • GAN-модели генерируют синтетические профили пользователей с реалистичной историей браузинга, паттернами покупок и демографией
  • LLM-боты имитируют динамику набора текста, паузы между кликами и даже голосовой ввод при телефонной верификации
  • Системы автоматически «прогревают» аккаунты — совершают мелкие легитимные транзакции перед крупным мошенническим списанием

Традиционные rule-based триггеры — необычная сумма, нетипичная геолокация — здесь не работают. Бот намеренно держится в «зелёной зоне» по всем параметрам.

Результат: chargeback-фрод (намеренное оспаривание законной транзакции покупателем через банк) растёт, потому что синтетические транзакции выглядят как реальные покупки, а потом оспариваются под предлогом кражи личности. Захват аккаунта становится сложнее детектировать, потому что AI-фишинговые письма персонализированы до уровня, который раньше требовал ручной работы.

Платформы переходят на анализ микроповеденческих паттернов — динамика нажатия клавиш, снятие отпечатков пальцев устройства, аномалии в движении мыши. Но это гонка вооружений: атакующие дообучают модели на данных о том, как работает детекция.

Что это значит для форензики: три вывода из практики

За последние три месяца в DeepVerify пришло несколько кейсов, которые хорошо иллюстрируют текущую ситуацию.

Кейс первый. Компания из крипто-сектора подозревала, что переговоры с «инвестором» велись с дипфейком. Запись звонка сохранилась. Анализ спектрограммы голоса выявил характерные артефакты вокодерной синтезации — периодические «провалы» в высокочастотном диапазоне 8–12 кГц, которые не встречаются в живой речи. Плюс анализ видео показал аномальную частоту моргания — 4 раза в минуту против нормы 15–20. Заключение подтвердило: дипфейк.

Кейс второй. Финтех-стартап получил претензию от партнёра — тот утверждал, что никогда не отправлял голосовое сообщение с определёнными инструкциями. Аудиофайл прошёл через несколько детекторов, все дали «человек». Мы применили дополнительный анализ просодии — ритмические паттерны ударений не совпадали с известными записями этого человека. Вывод: синтез с клонированием голоса.

Кейс третий. E-commerce платформа хотела понять, почему классический антифрод пропускает определённый тип транзакций. Поведенческий анализ показал слишком «правильные» паттерны — реальные пользователи делают ошибки, исправляют их, колеблются. Синтетические профили были статистически аномально «чистыми».

Вывод, который я делаю из этих кейсов: детекция сместилась от визуального к статистическому. Смотреть глазами уже недостаточно. Нужен анализ распределений, аномалий в паттернах, сравнение с эталонными записями.

Процедурные барьеры важнее технических детекторов

Это звучит контринтуитивно, но на практике подтверждается раз за разом.

Технический детектор дипфейков даёт точность 85–92% на тестовых наборах. В реальных условиях — ниже, потому что атакующие знают о детекторах и адаптируются. Процедурный барьер работает независимо от качества синтеза.

Что реально снижает риск:

  • Верификация через второй канал — перед любым действием по итогам видеозвонка перезвонить на известный номер. Не тот, что прислали в чате.
  • Кодовые слова для критических решений — заранее согласованная фраза, которую должен произнести «партнёр» перед подтверждением транзакции
  • Временной буфер — правило «никаких финансовых решений в течение 30 минут после звонка» ломает психологическое давление атаки
  • Запись и логирование — любой звонок с обсуждением финансов пишется. Это и доказательная база, и сдерживающий фактор

MFA и EDR — необходимы, но недостаточны. BlueNoroff успешно обходит MFA через социальную инженерию.

Отдельно про суды. Российская судебная практика по дипфейк-мошенничеству пока формируется, но прецеденты уже есть. Ключевая проблема — доказательная сила форензического заключения. Суды принимают технические экспертизы, но требуют чёткого описания методологии и воспроизводимости результатов. Это отличает серьёзную форензику от «прогнал через детектор и написал вывод».

Что дальше: угроза будет расти, инструменты — тоже

Real-time дипфейки станут дешевле. Уже сейчас порог входа снизился до уровня, когда атаку может организовать небольшая группа без специализированного оборудования. Через 12–18 месяцев качество синтеза в реальном времени вплотную приблизится к уровню, когда визуальные артефакты исчезнут полностью.

Это означает, что форензика будет работать преимущественно с метаданными, поведенческими паттернами и статистическими аномалиями — а не с визуальными артефактами. Детекторы, обученные на «пикселях», будут проигрывать. Детекторы, обученные на «поведении» — выигрывать.

Для бизнеса это значит одно: инвестировать в процедуры сейчас, пока атаки ещё оставляют следы. Через год следов может не остаться.

Если у вас есть свежий случай с подозрительным аудио или видео — киньте в комментарии или в личку, разберу публично с разрешения. Сообщество узнает, как такое выглядит изнутри.

Спасибо, что дочитали! Обещанный интерактив. Какое из этих фото является сгенерированным нейросетью? В следующей статье напишу правильный ответ.

Вариант №1
Вариант №1
Вариант №2
Вариант №2
Какое фото является сгенерированным?
Вариант №1
Вариант №2
Оба варианта
Начать дискуссию