Как китайцы из DeepSeek взорвали рынок ИИ, потратив в 20 раз меньше денег чем OpenAI
Привет, друзья, Климент на связи!
Последние несколько дней я внимательно следил за историей, которая может полностью изменить расстановку сил в мире ИИ. И нет, это не очередной анонс от OpenAI или Anthropic.
Китайский стартап DeepSeek сделал то, что многие считали невозможным – создал языковую модель уровня OpenAI o1 и Claude 3.5 Sonnet, потратив всего $5,6 млн. При этом, модель сразу попала на один уровень с американскими конкурентами, показывая топовые результаты в бенчмарках на размышление и другие задачи. Для сравнения: OpenAI вложили в разработку ChatGPT-4 $100+ млн, а стоимость более поздних моделей явно не уменьшилась.
Звучит безумно? Давайте разберемся, как китайцам это удалось.
В чём фишка?
Главный секрет DeepSeek – инновационный подход к архитектуре ИИ. Вместо того чтобы идти проторенной дорожкой и наращивать мощности, команда сделала ставку на три ключевые инновации:
- Оптимизация памяти: снизили точность вычислений, сэкономив 75% ресурсов без потери качества;
- Multi-token Prediction: научили модель читать текст целыми фразами, а не пословно;
- Мультиэкспертный подход: вместо одной огромной модели создали систему специализированных "экспертов".
На практике последний пункт означает, что при обработке запроса активируются только нужные "эксперты" – как если бы в компании над задачей работали только профильные специалисты, а не весь штат разом. На один запрос расходуется примерно 37 млрд из 671 млрд параметров, что обеспечивает экономию памяти и ресурсов, о чем я говорил выше. Гениально и просто!
Что это значит для рынка?
Эффект разорвавшейся бомбы — это даже мягко сказано. Акции NVIDIA рухнули на 12% после новостей о DeepSeek. Еще бы: если для работы достаточно 2048 GPU вместо 100 000 у ChatGPT, кому нужны супердорогие серверные решения?
Но главное – это подрыв монополии техгигантов. DeepSeek доказал: можно создавать конкурентоспособные ИИ-модели без бюджетов уровня OpenAI. Более того, их модель имеет открытый исходный код и ее можно натренировать на обычных видеокартах. Я не шучу, представители DeepSeek сами написали об этом в X:
Мой взгляд на ситуацию
Как человек, который много лет следит за развитием ИИ, могу сказать: мы наблюдаем исторический момент. Это сравнимо с появлением персональных компьютеров — технология, которая была доступна только гигантам, становится достоянием масс.
Что дальше?
Думаю, в ближайший год-два мы увидим взрывной рост небольших ИИ-стартапов, которые возьмут на вооружение подход DeepSeek. Эра монополии техгигантов в ИИ подходит к концу – и это прекрасные новости для всей индустрии.
А что думаете вы? Как оцениваете перспективы китайского подхода к разработке ИИ? Делитесь мнением в комментариях!
Что общего между Кремниевой долиной и китайским городом Ханчжоу? До вчерашнего дня — ничего. Но когда команда DeepSeek анонсировала свою новую ИИ-модель, созданную всего за 5.5 миллионов долларов, в офисах технологических гигантов начались экстренные совещания. В своей прошлой статье я упомянул новую нейросеть DeepSeek. В этой статье расскажу подро…
Недавно китайцы запустили "убийцу ChatGPT" – DeepSeek. Казалось бы, что ничего необычного в этом нет – еще одна нейросеть… но это только на первый взгляд
Как выглядит дизайн ресторана и интерьер кафе в 2025 году? Мы собрали фото ресторана внутри, кафе с красивым интерьером и тренды современного дизайна интерьера ресторана. А также расскажем, как создать кафе в современном стиле с уникальной атмосферой. Вдохновляйтесь ресторанами с красивым интерьером и находите нестандартные решения для своих проект…
Мнением поделился вице-президент по продукту и развитию ИИ-подразделения Dropbox Морган Браун.
Жаркие споры вокруг успеха DeepSeek продолжаются. Подведем некоторые промежуточные итоги
Китайская компания DeepSeek потрясла всех на этой неделе, выпустив одноимённую модель искусственного интеллекта - или, как модно говорить, Большую Языковую Модель (LLM - Large Language Model) - DeepSeek R1, которая по качеству догнала флагманскую модель GPT-o1. Затем они показали нейросеть для генерации изображений, превосходящую DALL-E и Stable Di…
Представьте, что вы сидите на золотой жиле, но копаете медленной ложкой вместо мощного экскаватора. Именно так обстоят дела у большинства B2B-компаний, которые лишь надеются на рекламу в Яндекс.Директе и не ищут другие каналы.
Китайская модель DeepSeek-R1 ворвалась в инфополе и вокруг неё уже строят громкие заголовки. «Убийца ChatGPT», «революция в генеративном ИИ», «конкурент OpenAI» — всё это мы уже слышали. Но давайте разберёмся, насколько модель действительно конкурентоспособна и стоит ли её воспринимать всерьёз.
Прошли выходные, и стало ясно, что на прошлой неделе на рынке AI была не просто очередная новость о релизе, а неплохо так жахнуло.
И нет, речь не о Stargate и их $500 млрд.
20 января китайцы из DeepSeek релизнули свою версию "думающей" модели R1, причем им удалось сделать ее почти такого же качества, как и OpenAI o1, а на некоторых тестах и лучше,…
Что означает появление новой китайской нейросети для российских пользователей? В чем преимущества?
Откуда взялся DeepSeek и кто за ним стоит?
Лян Вэньфэн окончил Чжэцзянский университет — один из старейших и самых престижных вузов Китая. После окончания Лян не пошел устраиваться на работу программистом и даже отказал своему другу Ван Тао работать вме…
Китайская DeepSeek бросила вызов лидерам ИИ, выпустив нейросети с открытым кодом и чат-ботом-хитом App Store. Узнайте, как OpenAI, Трамп и Nvidia отреагировали на прорыв, который перевернул представление о затратах на ИИ и спровоцировал обвал акций.
В мире искусственного интеллекта сейчас много разговоров. Китайская компания DeepSeek представила свою модель R1. Многим кажется, что она может составить серьезную конкуренцию западным конкурентам, вроде OpenAI и их ChatGPT. Давайте посмотрим, что произошло и почему китайцы в этой гонке впереди.
API ток еле шевелится у Deepseek) пока все лежит никто не может проверить так ли он крут как говорят
Согласен, что сейчас сложно полностью оценить реальные возможности DeepSeek, так как API находится на ранней стадии.
Однако уже есть независимые бенчмарки и тесты от сторонних разработчиков, которые подтверждают заявленную производительность.
Думаю, сегодня добавим новинку в сервис и проведём внутренние тесты. Результатами обязательно поделимся в нашем телеграмм-канале @gptunnel
Хороший и сильный конкурент. Даже под всеми санкциями и ограничениями на GPU смогли построить. Было забавно наблюдать, как фондовый рынок краснеет на фоне новостей
Согласен, санкции часто приводят к неожиданным результатам 👍
Китай в большинстве сфер выбивается в лидеры))) Но когда это в разы требует меньше ресурсов, как на создание,так и на содержание - это просто супер)))
И это только начало! Китайский подход к оптимизации ресурсов может стать новым стандартом в индустрии, кмк) Интересно будет посмотреть, как отреагируют западные компании.