Pixar напрягся
Будни офиса Miro
Бонобо Канзи
Рабочее место для кота
Протесты против Маска
«Офису» — 20 лет
Ламба из картона
Дорожка для аквабега
Jaguar Type 00 в Париже
Xiaomi SU7 Ultra
Полёт над Луной
Автопилот Tesla на бездорожье
«Игровые» Google Maps

DeepSeek vs. OpenAI, Nvidia и Microsoft

DeepSeek vs. OpenAI, Nvidia и Microsoft

Что означает появление новой китайской нейросети для российских пользователей? В чем преимущества?

Откуда взялся DeepSeek и кто за ним стоит?

Лян Вэньфэн окончил Чжэцзянский университет — один из старейших и самых престижных вузов Китая. После окончания Лян не пошел устраиваться на работу программистом и даже отказал своему другу Ван Тао работать вместе над его новым проектом летательных аппаратов. Вскоре Ван Тао основал компанию DJI, а Вэньфэн продолжал работать над своим алгоритмом для инвестиционных компаний на основе машинного обучения.
В 2013 году Вэньфэн основал инвестиционную компанию Jacobi, названнную в честь немецкого математика Карла Якоби. А в 2015 году вместе с двумя университетскими друзьями из Чжэцзянского университета создал хедж-фонд High-Flyer, который к 2019 году уже управлял активами на сумму $10 млрд. Сегодня этот фонд считается одним из крупнейших фондов в Китае.
В октябре 2016 года создал первую собственную модель искусственного интеллекта. В 2016 году High-Flyer фонд создал свою первую модель искусственного интеллекта, которая сама покупала или продавала ценные бумаги без участия человека.


Появление DeepSeek.
Если в России пользователи сталкиваются с трудностями при регистрации в ChatGPT, то в Китае, где проживает 1,5 млрд человек, OpenAI в принципе запрещена. Думаю, что это и подтолкнуло Ваньфэня запустить проект DeepSeek в 2023, как ответвление от основного бизнеса. Для вычислений он планировал использовать графический процессоры GPU от Nvidia, которые компания приобрела до санкций. Всего в наличии было 10 000 GPU. В конце 2024-го они выпустили первую генеративную модель искусственного интеллекта DeepSeek-V3, сравнимой по показателям с ChatGPT.

Почему произошла революция, которая потрясла мировых гигантов сферы ИИ?
Во-первых,
разработка модели DeepSeek обошлась всего в $5,6 млн по сравнению с $60 млн, потраченные на ChatGPT.

Во-вторых,
на обучение модели ушло всего 2 месяца. А это в разы меньше, чем у лидеров рынка. При том, что DeepSeek был ограничен американскими санкциями. Nvidia не могли продавать Китаю современные мощные и дорогие ускорители, поэтому DeepSeek обучался на урезанных дешевых ускорителях, что само по себе должно было растянуть процесс обучения. Но не растянуло и вызвало тем самым еще больше вопросов. "Ведь если можно также быстро обучать ИИ на дешевых чипах, зачем переплачивать?".
К тому же количество графических чипов необходимое для обучения DeepSeek в 50 раз меньше, чем у OpenAI. И тут как раз и произошел обвал акций Nvidia. Компания потеряла $500 млрд капитализации, а стоимость ее акций упала почти на 18%. Акции Siemens Energy, производителя энергетического оборудования для ИИ-инфраструктуры, - на 20 %.

Третим фактом
стало то, что китайская компания предоставила доступ к открытому коду DeepSeek с возможностью изменения в ней весовых параметров и в одночасье разрушила опасения всего мирового сообщества о необходимости держать "опасный и могущественный код" в одним руках. Это означает, что любая компания может развернуть модель DeepSeek R1 на своих серверах. В рамках ИИ - это весьма дерзкий ход.

Таоша Ван, портфельный менеджер Fidelity International, в феврале 2025 года рассказала, что стоимость разработки ведущих моделей ИИ уже упала примерно на 80% за последние два года, а DeepSeek, возможно, ускорит эту тенденцию.
Что означает появление DeepSeek для российских пользователей?

Начнем с того, что модель R-1 не уступает по показателям и производительности ChatGPT - o1.
- Также есть функция Reasoning (Deepthinking) для обдумывания более сложных задач и в DeepSeek она бесплатна.
- Регистрация опциональна через e-mail.
- Те функции, за которые в ChatGPT необходимо было платить $20 в месяц, в DeepSeek абсолютно бесплатны на данный момент.
- Любой пользователь может без труда установить мобильное приложение из Play Market или App Store.
- При желании можно установить базовую модель локально на свой компьютер и дообучить на своих данных.
- Также доступна функция Search Web в интернете в режиме реального времени.
- Стоимость API-запросов в шесть раз ниже, чем у OpenAI. И к тому же модель можно использовать территории России.
Думаю, DeepSeek - это game changer нашего времени! А как считаете вы?
Буду рада видеть вас в моем телеграм-канале @neurodvizh

44
22
2 комментария

Комментарий недоступен

1

Тестировал. Молодцы конечно! Но галлюцинирует местами .
Ждем когда России сделает нечто нечто подобное!

1

Рано пока делать выводы. Возможно хайп и потом загнется , дальше не продвинуться. Но пока можно пользоваться

1