География — это ложь: как я натравил Machine Learning на мировые валюты и что из этого вышло

Мы привыкли делить мир на «развитые страны» и «emerging markets». В учебниках экономики нам говорят: «евро — это надежно, а мексиканское песо — это риск». Но если убрать политику и оставить только голые цифры, картина меняется до неузнаваемости.

Я решил провести эксперимент: взял данные по 45 мировым валютам за последние годы и прогнал их через алгоритм кластеризации K-Means. Цель — понять, как валюты ведут себя на самом деле, а не как их называют в новостях.

Проблема «грязных» данных

Обычно курсы смотрят в парах к доллару (USD/RUB, USD/TRY). Но это ошибка: когда доллар штормит, кажется, что падают все остальные. Чтобы получить «чистый» характер валюты, я использовал абсолютные курсы с платформы abscur.ru. Это позволило увидеть реальную силу или слабость каждого актива в вакууме.

Что внутри «паспорта» валюты?

Каждую валюту я описал вектором из четырех параметров:

  • Доходность (CAGR) — долгосрочный тренд роста.
  • Волатильность — насколько сильно актив «нервничает».
  • Max Drawdown — глубина падения в моменты кризиса.
  • Recovery Days — ключевой показатель: сколько дней нужно активу, чтобы вернуться к росту после обвала.

4 типа «валютных личностей»

Алгоритм разделил мир на четыре четких лагеря:

🟢 Тихие гавани: где деньги спят спокойно

Сюда попали не только тяжеловесы (USD, EUR), но и лидеры эффективности: швейцарский франк (CHF, +3.07% годовых в абс. выражении) и китайский юань (CNY, +2.91%). Инсайт: В этом кластере восстановление после просадки занимает в среднем 30–50 дней. Это эталон финансовой регенерации.

🟡 Зоны долгого восстановления: «Валюты-зомби»

Самый коварный кластер. Они не умирают быстро, но если падают — то всерьез и надолго. Примеры: Казахстанский тенге (KZT) и колумбийское песо (COP). Цифры: Срок выхода из просадки здесь достигает 735 дней. Вы буквально замораживаете капитал на 2 года в ожидании «безубытка».

🟣 Турбулентные развивающиеся: американские горки

Здесь живет российский рубль (RUB), мексиканское песо (MXN) и рэнд (ZAR). Характер: Огромная волатильность (у рубля — 12.09%), но при этом живой тренд. Это активы для активных спекуляций, но никак не для спокойного сбережения.

🔴 Эпицентры девальвации: математические изгои

Аргентинское песо (ARS) и турецкая лира (TRY). Диагноз: Математика показывает, что эти валюты изолированы от мировых циклов. У них просадки под -99% и отрицательное матожидание. На графиках PCA они выглядят как «отлетевшие» далеко в сторону точки.

География — это ложь: как я натравил Machine Learning на мировые валюты и что из этого вышло

На графике «Риск vs Доходность» наглядно видно, как тикеры из красной зоны улетают в бесконечность по волатильности.

Почему это важно для тех, кто делает продукты или инвестирует?

  1. География не определяет риск. Норвежская крона (NOK) по цифрам оказалась ближе к стабильному франку, чем к волатильным соседям по Европе.
  2. Recovery Days — главная метрика. Глубина падения не так страшна, как время, которое вы проведете в «яме». ML помогает отсекать активы с «плохой генетикой» восстановления.
  3. Автоматизация здравого смысла. Вместо чтения аналитики можно один раз построить модель и увидеть, какие валюты действительно коррелируют между собой по поведению, а не по расположению на карте.

Для тех, кто хочет покопаться в коде: Я выложил весь процесс исследования на Kaggle — там и PCA-визуализация, и чистка данных на Python: 👉 Absolute FX Behavioral Profiling на Kaggle

А как вы выбираете валюту для диверсификации? Верите старым индексам или доверяете алгоритмам? Давайте обсудим в комментариях.

Начать дискуссию