Китайская DeepSeek обновила модель V3: в соцсетях заметили, что она «лучше» рассуждающей R1 в программировании
Компания заявила, что новая версия сравнима с Claude 3.7 Sonnet и превосходит GPT-4.5.
- Обновлённая DeepSeek-V3-0324 — это не рассуждающая модель, как R1. Но у неё «улучшенные» навыки в программировании и frontend-разработке, заявляют в компании.
- В некоторых тестах по математике и написанию кода модель сравнялась или обошла Claude 3.7 Sonnet от Anthropic.
- Из-за таких результатов в соцсетях предположили, что DeepSeek обучали на результатах Claude. Один из пользователей попросил две модели создать лендинг сайта по одному запросу и они оказались похожими.
- Другие пользователи посчитали, что модель всё равно ценна для сообщества, потому что у неё открытый исходный код.
Примеры тестов V3-0324 из соцсетей
- Модель можно использовать бесплатно на сайте или через API по цене $0,27 за 1 млн входящих токенов (около 23 рублей по курсу ЦБ на 25 марта 2025 года) и $1,10 за 1 млн исходящих (около 93 рублей). Открытый исходный код V3-0324 доступен на Hugging Face. Её сделали доступной по лицензии MIT для свободного использования ПО, как и DeepSeek-R1.
В техно и финансовых кругах развернулась дискуссия (если не сказать паника). Шутка ли, что можно вот так вот создать модель с 20 раз дешевле, да и еще в условиях санкций? Но не все так просто. Расскажу, в чем дело
Как разработчик, использующий искусственный интеллект в своих личных проектах в течение последнего года, я не могу не радоваться тому, что модель DeepSeek R-1 теперь доступна в Cursor AI.
DeepSeek — это не просто ещё одна AI-модель, а серьёзный конкурент ChatGPT, который может перевернуть рынок искусственного интеллекта. Созданный китайскими разработчиками за минимальные деньги ИИ уже вызывает беспокойство в Кремниевой долине. Почему эта бесплатная альтернатива становится новым стандартом? Разберёмся.
По словам стартапа, в двух тестах Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.
Мнением поделился вице-президент по продукту и развитию ИИ-подразделения Dropbox Морган Браун.
В мире маркетинга, где тренды часто меняются, а стратегии могут быть сиюминутными, метод Кирпича выделяется своей устойчивостью и долгосрочной ориентацией. Это подход, который напоминает строительство здания: кирпич за кирпичом, шаг за шагом. Но почему он получил такое название, и кто такие «кирпичные люди»? Давайте разбираться.
Что означает появление новой китайской нейросети для российских пользователей? В чем преимущества?
Откуда взялся DeepSeek и кто за ним стоит?
Лян Вэньфэн окончил Чжэцзянский университет — один из старейших и самых престижных вузов Китая. После окончания Лян не пошел устраиваться на работу программистом и даже отказал своему другу Ван Тао работать вме…
Новостные ленты продолжают сотрясать известия о выходе в свет очередной модели от Китайской компании DeepSeek. Откуда ни возьмись, повылезала куча всевозможных экспертов, в массе своей несущих полную ерунду. Я же с середины января 2024 года изучаю эту модель, и впечатление от неё крайне положительное. Ниже я расскажу, почему. Если вы пропустили вол…
Объясните, первая гифка, красный шарик крутится в шестиугольнике - это что означает?
42
Одна из них гавно, другая збс.
Греф был прав
На данный момент , только ддя небольших моголитных проектов.
Но, траектория - понятна..