Основатель DeepSeek: что известно о Лян Вэньфэне — главе ИИ-компании, которая взволновала рынки
Он скупал видеокарты и обучал ИИ ещё до «бума нейросетей».
- Лян Вэньфэн (梁文锋 или Liang Wenfeng) родился в 1985 году в Чжанцзяне, провинция Гуаньдун. Его родители работали учителями китайского языка в начальных классах.
- В школе у Ляна возник интерес к математике, а позже он отучился в местном университете, где получил степени бакалавра и магистра по информационной и коммуникационной инженерии. Специализировался Лян на машинном зрении.
- По рассказам знакомых, в студенчестве предприниматель был «замкнутым и нелюдимым», но несмотря на это, в 2008 году, в разгар финансового кризиса, Лян Вэньфэн собрал команду из своих одногруппников для сбора данных о финансовых рынках. Вместе они пытались использовать машинное обучение для количественного трейдинга — стратегии торговли, в которой используются математические модели и алгоритмы.
- Лян Вэньфэн всегда верил, что «ИИ изменит мир», но тогда у него не было единомышленников, а многие даже посмеивались и говорили ему, что он «смотрит слишком много научной фантастики».
Алгоритмическая торговля и покупка видеокарт
- После учёбы Лян пробовал придумывать идеи для применения ИИ в разных сферах, пока не остановился на финансах. В 2015 году предприниматель соосновал хедж-фонд High-Flyer — он использовал искусственный интеллект, чтобы принимать инвестиционные решения и предугадывать тренды на рынке. Название компании на китайском — 幻方 или «магический квадрат».
- В 2019 году фонд основал компанию High-Flyer AI для изучения ИИ в алгоритмическом трейдинге и вложил 200 млн юаней (это примерно 2,6 млрд по курсу ЦБ на 29 января 2024 года) в разработку модели Yinghuo, для которой компания закупила 1100 графических процессорах от Nvidia. А в 2021 году инвестировал ещё 1 млрд юаней (13,4 млрд рублей) в Yinghuo 2, для которой купили уже 10 тысяч видеокарт.
- К этому времени в управлении High-Flyer были активы на 100 млрд юаней (1,3 трлн рублей). А для торговли компания использовала только ИИ — и работала по примеру Renaissance Technologies, которая специализируется на торговле при помощи математических и статистических методов.
- Как объяснял Лян, видеокарты для обучения моделей он покупал в основном из любопытства, а не из-за тайной бизнес-логики: ему было интересно узнать, как далеко может зайти ИИ. По его словам, для сторонних наблюдателей именно OpenAI с ChatGPT перевернули отрасль, но тем, кто давно интересовался ИИ, ещё на выпуске GPT-3 в 2020 году стало понятно, что искусственному интеллекту понадобятся огромные вычислительные мощности. И всё же «большинство» недоумевало, зачем Лян Вэньфэн тратит деньги на графические процессоры.
Как появился DeepSeek
- Сколотив неплохое состояние на алгоритмической торговле, Лян Вэньфэн решил вернуться к идее исследований общего ИИ (AGI): в 2023 году он объявил, что создаст компанию DeepSeek, которая не будет связана с трейдингом и отделится от High-Flyer.
- При найме новых сотрудников компания ориентируется не на опыт, а на «страсть» к работе и прикладные навыки. Большинство работников — недавние выпускники или начинающие специалисты.
- В мае 2024 года фирма выпустила модель DeepSeek-V2, в ноябре — DeepSeek-V3, а в январе 2025-го — «думающую»
DeepSeek-R1, которая решает задачи по математике и программированию «лучше» или на уровне o1 от OpenAI.
Понедельник, 27 января, начался с крупнейшего однодневного падения компании в истории фондового рынка США. Акции NVIDIA упали на 18%, а прибыль снизилась на $589 миллиардов. А все из-за китайской версии «синего кита» — точнее, выхода ИИ-модели DeepSeek-R1. Издание The New Yorker назвало ситуацию «Sputnik moment», по аналогии с отправкой первого чел…
Криптовалюты становятся всё более популярными, а вместе с ними растёт потребность в их безопасном хранении. Чтобы защитить свои цифровые активы, необходимо выбрать надёжный кошелек для криптовалюты. В этой статье мы разберёмся, что это такое, какие бывают криптокошельки и как ими пользоваться.
Её чат-бот до сих пор первый в списке самых скачиваемых бесплатных приложений в американском App Store.
В техно и финансовых кругах развернулась дискуссия (если не сказать паника). Шутка ли, что можно вот так вот создать модель с 20 раз дешевле, да и еще в условиях санкций? Но не все так просто. Расскажу, в чем дело
DeepSeek, китайский стартап в области искусственного интеллекта (подробнее про стартап), привлек мировое внимание благодаря своей новой языковой модели DeepSeek-R1, которая успешно конкурирует с решениями OpenAI, такими как ChatGPT. Вот несколько вариантов, как можно заработать на этом стартапе:
Я думал этот
ДЗАНЯЯЯЯЯЯЯНГ!!!
Не хот-дог
Откуда, не подскажите?
Самый прагматичный чувак в фильме
Все смотрели, все поняли. Чего?
Выяснится, что прост спиздил все данные у опенаи. Надрочил свою модель - и поджёг пердак Альтмана. Красава!