DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔

Если ваши позиции в крипте еще не ликвидировало и вы готовы воспринимать какую-то информацию, тогда это для вас

Недавно китайцы запустили "убийцу ChatGPT" – DeepSeek. Казалось бы, что ничего необычного в этом нет – еще одна нейросеть… но это только на первый взгляд

DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔

На деле же, DeepSeek – это не просто еще одна нейросеть, а, скорее, новая веха развития в мире искусственного интеллекта

_____

Сейчас обучение топовых AI-моделей стоит космических денег. OpenAI, Anthropic и другие тратят $100M+ только на вычислительные мощности

Помимо этого, им нужны огромные дата-центры с тысячами GPU стоимостью $40K+ каждый (это как строить целую электростанцию, чтобы запустить один завод)

А теперь представьте. DeepSeek приходит и говорит:

"А давайте сделаем это за $5M?"

И они не просто говорят – они реально это делают. Их модели уже конкурируют с GPT-4 и Claude по многим задачам

_____

Традиционные модели используют 32-битные числа для расчетов

DeepSeek перешел на 8-битные, что сократило потребление памяти на 75%

Обычные AI читают текст как первоклассники: "Кот... сидит... на... ковре..."

DeepSeek обрабатывает целые фразы сразу, что делает его в 2 раза быстрее при сохранении 90% точности

Вместо одной огромной модели, которая пытается знать всё (как юрист, врач, инженер в одном лице), DeepSeek использует "узких экспертов", которые активируются только тогда, когда это нужно

Например:

- Традиционные модели: 1.8 триллиона параметров активны постоянно

- DeepSeek: 671 миллиардов параметров, но только 37 миллиардов активны одновременно

Условно говоря, когда вы делаете юридический запрос, то вам отвечает "AI-юрист", который "имеет экспертизу в этой области", а не "AI-инженер", который ничего в этом не понимает. Это позволяет сделать ответ более точным и специализированным

_____

- Стоимость обучения: $100M → $5M

- Количество GPU: 100,000 → 2,000

- API-запросы: на 95% дешевле

- Аппаратное обеспечение: вместо дата-центров – обычные игровые видеокарты

https://x.com/morganb/status/1883686162709295541?s=46

_____

1. AI становится доступнее

Теперь для разработки AI не нужны миллиардные бюджеты

Несколько мощных GPU – и вы в игре

2. Конкуренция растет

Гибкие стартапы вроде DeepSeek бросают вызов гигантам вроде OpenAI и Anthropic

3. Стоимость оборудования падает

NVIDIA, которая зарабатывает на сверхдорогих GPU, теперь в зоне риска

А поскольку NVIDIA занимает первое место в мире по рыночной капитализации ($3.4 трлн), то новости о зарождении конкурентов, которые могут приостановить количество поставок GPU, понятное дело, вызовет определенные колебания на рынке

В свою очередь, крипторынок, который на данный момент до сих пор зависит от фондового, идет вслед за ним (но только семимильными шагами) 😁

Также у меня есть TG-канал, в котором все посты появляются намного раньше и чаще – жду каждого!

DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔

Так в чем дело?

Как им это удалось?

1. Оптимизация вычислений

2. Мультитокенность ("multi-token" system)

3. Экспертная система

Что это дает? 🚀

Более подробно можете почитать здесь:

Почему это влияет на рынок?