Дик пик… DeepSeek: как переродился «Синий кит», но в виде нейросети. Блог Красовского - полный разбор.
Друзья, вы точно уже читали новости о новой нейросетке Deep Seek, которая громко заявила о себе. С каждым днём гонка двух мастифов накаляется в геометрической прогрессии. Следствием такой популярности стало сарафанное радио и главный вопрос общественности: почему бесплатно?
Небольшое предисловие. В моей компании «Компьютерные Технологии» мы давно активно используем нейросети в работе. Держим руку на пульсе и тестируем новые AI-инструменты сразу после их выхода.
Для генерации изображений наш маркетинговый отдел использует Adobe Firefly и Midjourney. Для более сложных аналитических задач — Chat GPT: он помогает анализировать таблицы, выстраивать тренды, накидывать идеи, позволяет выгружать в него файлы и создавать их. Настоящая палочка-выручалочка, которая сокращает затраты времени в разы и автоматизирует часть процессов. Конечно, у Chat GPT есть свои ограничения из серии краткосрочность памяти, периодически нужно выгружать файлы заново или запрашивать перепроверить свой ответ. Безусловно к ним нужно приноровиться, но польза от них очевидна.
И вот на горизонте новая крупная AI-система. Китайцы выкатили DeepSeek, который претендует на звание азиатского ответа Open AI. Бесплатно, мощно, но с нюансами.
Разбираем, что внутри и что привело к его фурору.
В конце января нейросеть стали активно обсуждать: сначала специалисты Кремниевой долины, потом СМИ, потом обычные пользователи. В итоге 27 января приложение DeepSeek заняло первое место в топе бесплатных приложений App Store в США, а 28 января — в России. По данным сервиса Sensor Tower, 80% загрузок пришлось на период с 20 января.
Разработчики достигли этого благодаря эффективной модели обучения, которая оказалась значительно дешевле подходов конкурентов. В отличие от других нейросетей, DeepSeek построена на архитектуре "mixture of experts", позволяющей обрабатывать данные раздельно, применяя соответствующую экспертность в нужной области. Это позволило обучить модель всего за пару месяцев на относительно скромном кластере из видеокарт NVIDIA H800, затратив около $5,6 миллионов — в 20 раз меньше, чем у конкурентов.
Чем он удивил:
✔ Разбирается в сложных запросах и даёт довольно логичные ответы.
✔ Может работать с текстом, кодом и даже анализировать данные.
Но есть и смешные моменты как «тревожные» размышления нейросетки над ответом. Так же он активно избегает темы китайской политики) Я бы сказал, что Deep Seek на данный момент хорош для решения креативных задач, связанных с кодом и вычислениями, если лень включать VPN или нет возможности пользоваться платным GPT.
Из полезного - открытый исходный код, конструктор для разработчиков. Берёшь основу, допиливаешь под свои задачи и получаешь нейросеть, которая работает именно так, как нужно. DeepSeek можно обучить на своих данных, встроить в готовые проекты и адаптировать под конкретные бизнес-процессы – удобно.
Однако понадобится достаточно мощная техника для нормальной производительности.
Какие модели предлагает DeepSeek?
· DeepSeek-V3: Построена на архитектуре Mixture-of-Experts (MoE) и оптимизирована для многозадачности — от программирования до математических вычислений и работы с разными языками.
· DeepSeek-R1: специализируется на логическом мышлении и решении сложных задач, используя оптимизированное обучение с подкреплением.
Из минусов долгое ожидание ответа, периодические сбои из-за сильной нагрузки на сервера. Очень много отзывов из разряда «на третьем запросе ответы стали хуже» и «данные не актуальны». Китайцы тестят свой продукт, но пока что он на стадии развития. Безусловно шансы на эволюцию есть, однако надо ждать, а пока можно побаловаться.
Последний немаловажный вопрос: может ли Deep Seek генерить картинки? Сама нейросеть не может, на данный момент компания разработала отдельную модель Janus Pro (cразу чувствуется, что с неймингом у китайцев всё в порядке)). Пока модель ограничена и создаёт картинки размером 384×384 пикселя, что маловато, но текст формирует лучше, чем DALL-E от Open AI.
По итогу мы имеем нейросеть, которую можно развернуть локально, однако всё ещё с недочётами, но это вопрос времени. Рынок держит участников в узде, поэтому по правилам самурая цели нет, есть только путь, по которому компании будут совершенствовать свой продукт. Ждём, когда Deep Seek объединит генерацию картинок и текстовые запросы и будем сравнивать через полгода.
Если у вас уже был опыт работы с Deep Seek и Chat GPT, пишите в комментариях, какие задачи они закрывали эффективнее.
В своём телеграм канале пишу про новости в сфере IT и автоматизации, подписывайтесь, чтобы не пропустить)
Что общего между Кремниевой долиной и китайским городом Ханчжоу? До вчерашнего дня — ничего. Но когда команда DeepSeek анонсировала свою новую ИИ-модель, созданную всего за 5.5 миллионов долларов, в офисах технологических гигантов начались экстренные совещания. В своей прошлой статье я упомянул новую нейросеть DeepSeek. В этой статье расскажу подро…
Уже слышали про DeepSeek? Эта китайская нейросеть ворвалась в топ, обрушила акции IT-гигантов и показала, что нейросети можно тренировать быстрее, дешевле, без топового железа, а западные компании, возможно, просто раздували AI-пузырь.
Мы решили попробовать подключить сервис и замерить результаты. Рассказываем, что вышло: исследование провели на примере интернет-магазина бизнес-сувениров и корпоративных подарков TooManyGifts.
DeepSeek — это не просто ещё одна AI-модель, а серьёзный конкурент ChatGPT, который может перевернуть рынок искусственного интеллекта. Созданный китайскими разработчиками за минимальные деньги ИИ уже вызывает беспокойство в Кремниевой долине. Почему эта бесплатная альтернатива становится новым стандартом? Разберёмся.
Всем привет! Меня зовут Андрей Симагин и сегодня я к вам с новой версией браузерного расширения SiteAnalyzer SEO Tools 2.3, в котором добавлена возможность сравнения поисковой выдачи по ТОП 10-20-30 в Яндексе и Google, добавлена визуализация микроразметки Schema.org, добавлена статистика страниц в индексе поисковой системы Bing и другие изменения.…
DeepSeek Chat — китайская нейросеть с открытым исходным кодом, ориентированная на выполнение задач, таких как программирование, генерация текстов и анализ загруженных файлов. Платформа предлагает функциональность, схожую с ChatGPT, но с рядом уникальных особенностей, которые могут сделать её привлекательной альтернативой.
"Я бы сказал, что Deep Seek на данный момент хорош для решения креативных задач, связанных с кодом и вычислениями, если лень включать VPN или нет возможности пользоваться платным GPT."
Во, хоть кто-то толком привязал инфоповод к практической жизни )))
Точно, а то все одно и тоже
На этой неделе как раз давал комментарии журналистам про утечки информации из этой нейронки
О, очень интересно. Дайте ссылку!
То, что они не защищают данные и говорят, что модель учится на них, конечно, огромный минус.
Но как работает моделька, мне очень нравится.
классно расписал;))
Спасибо!