География — это ложь: как я натравил Machine Learning на мировые валюты и что из этого вышло
Мы привыкли делить мир на «развитые страны» и «emerging markets». В учебниках экономики нам говорят: «евро — это надежно, а мексиканское песо — это риск». Но если убрать политику и оставить только голые цифры, картина меняется до неузнаваемости.
Я решил провести эксперимент: взял данные по 45 мировым валютам за последние годы и прогнал их через алгоритм кластеризации K-Means. Цель — понять, как валюты ведут себя на самом деле, а не как их называют в новостях.
Проблема «грязных» данных
Обычно курсы смотрят в парах к доллару (USD/RUB, USD/TRY). Но это ошибка: когда доллар штормит, кажется, что падают все остальные. Чтобы получить «чистый» характер валюты, я использовал абсолютные курсы с платформы abscur.ru. Это позволило увидеть реальную силу или слабость каждого актива в вакууме.
Что внутри «паспорта» валюты?
Каждую валюту я описал вектором из четырех параметров:
- Доходность (CAGR) — долгосрочный тренд роста.
- Волатильность — насколько сильно актив «нервничает».
- Max Drawdown — глубина падения в моменты кризиса.
- Recovery Days — ключевой показатель: сколько дней нужно активу, чтобы вернуться к росту после обвала.
4 типа «валютных личностей»
Алгоритм разделил мир на четыре четких лагеря:
🟢 Тихие гавани: где деньги спят спокойно
Сюда попали не только тяжеловесы (USD, EUR), но и лидеры эффективности: швейцарский франк (CHF, +3.07% годовых в абс. выражении) и китайский юань (CNY, +2.91%). Инсайт: В этом кластере восстановление после просадки занимает в среднем 30–50 дней. Это эталон финансовой регенерации.
🟡 Зоны долгого восстановления: «Валюты-зомби»
Самый коварный кластер. Они не умирают быстро, но если падают — то всерьез и надолго. Примеры: Казахстанский тенге (KZT) и колумбийское песо (COP). Цифры: Срок выхода из просадки здесь достигает 735 дней. Вы буквально замораживаете капитал на 2 года в ожидании «безубытка».
🟣 Турбулентные развивающиеся: американские горки
Здесь живет российский рубль (RUB), мексиканское песо (MXN) и рэнд (ZAR). Характер: Огромная волатильность (у рубля — 12.09%), но при этом живой тренд. Это активы для активных спекуляций, но никак не для спокойного сбережения.
🔴 Эпицентры девальвации: математические изгои
Аргентинское песо (ARS) и турецкая лира (TRY). Диагноз: Математика показывает, что эти валюты изолированы от мировых циклов. У них просадки под -99% и отрицательное матожидание. На графиках PCA они выглядят как «отлетевшие» далеко в сторону точки.
На графике «Риск vs Доходность» наглядно видно, как тикеры из красной зоны улетают в бесконечность по волатильности.
Почему это важно для тех, кто делает продукты или инвестирует?
- География не определяет риск. Норвежская крона (NOK) по цифрам оказалась ближе к стабильному франку, чем к волатильным соседям по Европе.
- Recovery Days — главная метрика. Глубина падения не так страшна, как время, которое вы проведете в «яме». ML помогает отсекать активы с «плохой генетикой» восстановления.
- Автоматизация здравого смысла. Вместо чтения аналитики можно один раз построить модель и увидеть, какие валюты действительно коррелируют между собой по поведению, а не по расположению на карте.
Для тех, кто хочет покопаться в коде: Я выложил весь процесс исследования на Kaggle — там и PCA-визуализация, и чистка данных на Python: 👉 Absolute FX Behavioral Profiling на Kaggle
А как вы выбираете валюту для диверсификации? Верите старым индексам или доверяете алгоритмам? Давайте обсудим в комментариях.