DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔
Если ваши позиции в крипте еще не ликвидировало и вы готовы воспринимать какую-то информацию, тогда это для вас
Недавно китайцы запустили "убийцу ChatGPT" – DeepSeek. Казалось бы, что ничего необычного в этом нет – еще одна нейросеть… но это только на первый взгляд
На деле же, DeepSeek – это не просто еще одна нейросеть, а, скорее, новая веха развития в мире искусственного интеллекта
_____
Так в чем дело?
Сейчас обучение топовых AI-моделей стоит космических денег. OpenAI, Anthropic и другие тратят $100M+ только на вычислительные мощности
Помимо этого, им нужны огромные дата-центры с тысячами GPU стоимостью $40K+ каждый (это как строить целую электростанцию, чтобы запустить один завод)
А теперь представьте. DeepSeek приходит и говорит:
"А давайте сделаем это за $5M?"
И они не просто говорят – они реально это делают. Их модели уже конкурируют с GPT-4 и Claude по многим задачам
_____
Как им это удалось?
1. Оптимизация вычислений
Традиционные модели используют 32-битные числа для расчетов
DeepSeek перешел на 8-битные, что сократило потребление памяти на 75%
2. Мультитокенность ("multi-token" system)
Обычные AI читают текст как первоклассники: "Кот... сидит... на... ковре..."
DeepSeek обрабатывает целые фразы сразу, что делает его в 2 раза быстрее при сохранении 90% точности
3. Экспертная система
Вместо одной огромной модели, которая пытается знать всё (как юрист, врач, инженер в одном лице), DeepSeek использует "узких экспертов", которые активируются только тогда, когда это нужно
Например:
- Традиционные модели: 1.8 триллиона параметров активны постоянно
- DeepSeek: 671 миллиардов параметров, но только 37 миллиардов активны одновременно
Условно говоря, когда вы делаете юридический запрос, то вам отвечает "AI-юрист", который "имеет экспертизу в этой области", а не "AI-инженер", который ничего в этом не понимает. Это позволяет сделать ответ более точным и специализированным
_____
Что это дает? 🚀
- Стоимость обучения: $100M → $5M
- Количество GPU: 100,000 → 2,000
- API-запросы: на 95% дешевле
- Аппаратное обеспечение: вместо дата-центров – обычные игровые видеокарты
Более подробно можете почитать здесь:
https://x.com/morganb/status/1883686162709295541?s=46
_____
Почему это влияет на рынок?
1. AI становится доступнее
Теперь для разработки AI не нужны миллиардные бюджеты
Несколько мощных GPU – и вы в игре
2. Конкуренция растет
Гибкие стартапы вроде DeepSeek бросают вызов гигантам вроде OpenAI и Anthropic
3. Стоимость оборудования падает
NVIDIA, которая зарабатывает на сверхдорогих GPU, теперь в зоне риска
А поскольку NVIDIA занимает первое место в мире по рыночной капитализации ($3.4 трлн), то новости о зарождении конкурентов, которые могут приостановить количество поставок GPU, понятное дело, вызовет определенные колебания на рынке
В свою очередь, крипторынок, который на данный момент до сих пор зависит от фондового, идет вслед за ним (но только семимильными шагами) 😁
Также у меня есть TG-канал, в котором все посты появляются намного раньше и чаще – жду каждого!