реклама
разместить

Китайская DeepSeek обновила модель V3: в соцсетях заметили, что она «лучше» рассуждающей R1 в программировании

Компания заявила, что новая версия сравнима с Claude 3.7 Sonnet и превосходит GPT-4.5.

  • Обновлённая DeepSeek-V3-0324 — это не рассуждающая модель, как R1. Но у неё «улучшенные» навыки в программировании и frontend-разработке, заявляют в компании.
Пользователь попросил рассуждающую R1 и новую версию V3 написать код для анимации шара внутри шестиугольника с соблюдением законов физики. Он отметил, что V3 «не дотягивает до уровня GPT-4.5». Источник: Flavio Adamo
  • В некоторых тестах по математике и написанию кода модель сравнялась или обошла Claude 3.7 Sonnet от Anthropic.
Источник: DeepSeek
Источник: DeepSeek
  • Из-за таких результатов в соцсетях предположили, что DeepSeek обучали на результатах Claude. Один из пользователей попросил две модели создать лендинг сайта по одному запросу и они оказались похожими.
Результат DeepSeek-V3-0324. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.reddit.com%2Fr%2FClaudeAI%2Fcomments%2F1jjeobd%2Fclaude_sonnet_37_vs_deepseek_v3_0324%2F%3Futm_source%3Dshare%26amp%3Butm_medium%3Dweb3x%26amp%3Butm_name%3Dweb3xcss%26amp%3Butm_term%3D1%26amp%3Butm_content%3Dshare_button&postId=1885467" rel="nofollow noreferrer noopener" target="_blank">iaka-iaka</a>
Результат DeepSeek-V3-0324. Источник: iaka-iaka
Результат Sonnet 3.7. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.reddit.com%2Fr%2FClaudeAI%2Fcomments%2F1jjeobd%2Fclaude_sonnet_37_vs_deepseek_v3_0324%2F%3Futm_source%3Dshare%26amp%3Butm_medium%3Dweb3x%26amp%3Butm_name%3Dweb3xcss%26amp%3Butm_term%3D1%26amp%3Butm_content%3Dshare_button&postId=1885467" rel="nofollow noreferrer noopener" target="_blank">iaka-iaka</a>
Результат Sonnet 3.7. Источник: iaka-iaka
  • Другие пользователи посчитали, что модель всё равно ценна для сообщества, потому что у неё открытый исходный код.

Примеры тестов V3-0324 из соцсетей

Пользователь попросил DeepSeek сделать «крутую игру» для three.js. Получился 3D-шутер с подсчётом очков. Источник: AK
Автор сравнил, как DeepSeek-V3 (слева) и  R1 (справа) сделают карточки погоды. Первая справилась  «лучше». Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fcobaltdigital33%2Fstatus%2F1904179361856508044&postId=1885467" rel="nofollow noreferrer noopener" target="_blank">Miles Oliver</a>
Автор сравнил, как DeepSeek-V3 (слева) и  R1 (справа) сделают карточки погоды. Первая справилась «лучше». Источник: Miles Oliver
Модель создала игру «Визуализатор звуковых волн». С первого раза получился «невероятный результат», написал пользователь. Источник: Haider
Автор попросил DeepSeek-V3 создать «самый красивый и сложный скрипт для анимации». Получился результат, где можно регулировать размер и скорость движения элементов. Источник: Ysqander
Пример интерактивной веб-страницы, код для которой написала V3-0324. Источник: el.cine
Результат V3-0324 по запросу: «Создай интерактивную симуляцию молекул воды, которые образуют и разрывают водородные связи. Также добавь ползунок температуры». Источник: Parul Pandey
  • Модель можно использовать бесплатно на сайте или через API по цене $0,27 за 1 млн входящих токенов (около 23 рублей по курсу ЦБ на 25 марта 2025 года) и $1,10 за 1 млн исходящих (около 93 рублей). Открытый исходный код V3-0324 доступен на Hugging Face. Её сделали доступной по лицензии MIT для свободного использования ПО, как и DeepSeek-R1.
2828
55
22
11
11
реклама
разместить
47 комментариев

Объясните, первая гифка, красный шарик крутится в шестиугольнике - это что означает?

1

Одна из них гавно, другая збс.

Греф был прав

3

На данный момент , только ддя небольших моголитных проектов.
Но, траектория - понятна..

Раскрывать всегда
Почему рано хоронить OpenAI и превозносить DeepSeek?

В техно и финансовых кругах развернулась дискуссия (если не сказать паника). Шутка ли, что можно вот так вот создать модель с 20 раз дешевле, да и еще в условиях санкций? Но не все так просто. Расскажу, в чем дело

Лаг между "эффектом доступа" и "эффектом производительности". <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fblog.heim.xyz%2Fdeepseek-what-the-headlines-miss%2F&postId=1778418" rel="nofollow noreferrer noopener" target="_blank">Источник</a><br />
1111
Модель DeepSeek R-1 добавили в инструмент для программистов Cursor AI
Модель DeepSeek R-1 добавили в инструмент для программистов Cursor AI

Как разработчик, использующий искусственный интеллект в своих личных проектах в течение последнего года, я не могу не радоваться тому, что модель DeepSeek R-1 теперь доступна в Cursor AI.

22
Тур в Грузию на майские: комфорт, красота и гастрономия-2025
Туры в Грузию из Москвы – удобный формат для незабываемого отдыха.
Зачем платить за ChatGPT, если есть DeepSeek: бесплатная альтернатива, которая удивляет

DeepSeek — это не просто ещё одна AI-модель, а серьёзный конкурент ChatGPT, который может перевернуть рынок искусственного интеллекта. Созданный китайскими разработчиками за минимальные деньги ИИ уже вызывает беспокойство в Кремниевой долине. Почему эта бесплатная альтернатива становится новым стандартом? Разберёмся.

Зачем платить за ChatGPT, если есть DeepSeek: бесплатная альтернатива, которая удивляет
11
Китайский DeepSeek представил модели Janus Pro для генерации картинок

По словам стартапа, в двух тестах Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.

Сравнение результатов Janus и Janus-Pro-7B. Источник: DeepSeek
3232
88
33
33
11
Ребята решили просто уничтожить кое-кого и заодно обвалить свои серваки (-: Но и молодцы, давайте! К утру должна быть новость о запуске опенсорсного Скайнет 😁
Требует меньше мощностей, денег и времени: почему китайская нейросеть DeepSeek заставила Кремниевую долину «встрепенуться»

Мнением поделился вице-президент по продукту и развитию ИИ-подразделения Dropbox Морган Браун.

Источник фото: elEconomista 
149149
4040
44
33
11
11
Лайк. Deepseek очень крут.
Метод Кирпича в маркетинге: основательность, которая строит успех годами

В мире маркетинга, где тренды часто меняются, а стратегии могут быть сиюминутными, метод Кирпича выделяется своей устойчивостью и долгосрочной ориентацией. Это подход, который напоминает строительство здания: кирпич за кирпичом, шаг за шагом. Но почему он получил такое название, и кто такие «кирпичные люди»? Давайте разбираться.

Метод Кирпича в маркетинге: основательность, которая строит успех годами
33
11
Новая Qwen 2.5-Max от Alibaba и модели DeepSeek — чем отличаются продукты китайских разработчиков

Последняя модель Qwen, по заявлениям компании, превосходит DeepSeek V3.

Qwen 2.5-Max написала код для игры «Змейка»
3131
88
77
11
DeepSeek vs. OpenAI, Nvidia и Microsoft

Что означает появление новой китайской нейросети для российских пользователей? В чем преимущества?

Откуда взялся DeepSeek и кто за ним стоит?

Лян Вэньфэн окончил Чжэцзянский университет — один из старейших и самых престижных вузов Китая. После окончания Лян не пошел устраиваться на работу программистом и даже отказал своему другу Ван Тао работать вме…

44
22
реклама
разместить
DeepSeek-R1 против QwQ-32B от Alibaba — сравнение рассуждающих моделей от китайских компаний

Привели примеры, как они пишут код, SQL-запрос и создают игру.

1111
33
11
11
DeepSeek R1. Новая эра рассуждающих моделей
DeepSeek R1. Новая эра рассуждающих моделей

Новостные ленты продолжают сотрясать известия о выходе в свет очередной модели от Китайской компании DeepSeek. Откуда ни возьмись, повылезала куча всевозможных экспертов, в массе своей несущих полную ерунду. Я же с середины января 2024 года изучаю эту модель, и впечатление от неё крайне положительное. Ниже я расскажу, почему. Если вы пропустили вол…

11
Вышла новая версия китайской открытой LLM DeepSeek-V3, которая лучше о1 от OpenAI
Вышла новая версия китайской открытой LLM DeepSeek-V3, которая лучше о1 от OpenAI