W12 (@id5973931) — Блог на vc.ru

Всем привет! Мне 11 лет. Я часто думал, почему билеты на самолёты и поезда стоят так дорого. Сначала я хотел изобрести новый супер-двигатель, но физика — суровая штука, и реальные технологии стоят миллиарды.Тогда я решил поменять саму бизнес-модель. Я заставил систему зарабатывать на рейсе так много, чтобы билет для обычного пассажира стоил 0 рубле…

Что думаете ?

🚀 Это гениально! Модель рабочая, цифры бьются. Я бы полетел хоть сейчас.

📦 Сработает, но только для поездов. В авиации слишком строгие правила безопасности для такой схемы.

📺 Пассажиры взбунтуются. Никто не захочет смотреть рекламу 4 часа подряд ради бесплатного билета.

💼 Старые корпорации всё заблокируют. РЖД и Аэрофлот просто не пустят новичка на рынок.

🛑 Слишком рискованно. Если маркетплейсы уйдут, компания моментально обанкротится.

W12

30 мая

Великий обман Кремниевой долины: Почему Сэм Альтман врет про АЭС для ИИ, а ваш старый ПК может крутить сверхразум за копейки

Главный секрет ИИ-монополистов, который они скрывают от инвесторов. Честный эксперимент на видеокарте Nvidia T4, разрушающий триллионный миф.

W12

29 мая

Хватит строить АЭС под ИИ: Как 1-битный MoE-ансамбль сжимает нейросети в 20 раз и уничтожает облачную монополию гигантов

Пока OpenAI и Google заливают лень своих разработчиков миллиардами долларов, независимый опенсорс доказывает: будущее ИИ весит копейки и помещается на флешку.

W12

29 мая

Убийца корпоративных облаков: как сжать ИИ в 20 раз и утереть нос ленивым гигантам

Пока крупные корпорации сжигают гигаватты энергии и строят целые АЭС под свои «жирные» нейросети, опенсорс доказывает, что всё дело в банальной лени программистов.

Я взял передовую архитектуру Mixture of Experts (как в GPT-4), перевёл на экстремальные 1-битные рельсы и на копеечной видеокарте Nvidia T4 сжал слой со 125 МБ до 6.2 МБ (сжатие в 20 раз…

W12

16 мая

Тест производительности: выжимаем 100% из CPU в Google Colab. С++20/AVX2 против Python на 50 000 000 объектов.Это прорыв в мире видеокарт ?

Привет! Чтобы не быть голословным в разговорах об оптимизации, я провел серию жестких стресс-тестов своего гибридного no-CUDA движка прямо в стандартном окружении Google Colab на базовом двухъядерном CPU Intel Xeon.

Задача: Загрузка, фильтрация по условию и квантование (bfloat16) крупного массива данных объемом 50 000 000 объектов.

Вот реальные рез…

W12

16 мая

Отцените пожалуйсто

Привет, хабровчане и vc-сообщество!

В прошлый раз я рассказывал про архитектуру своего no-CUDA движка, а сегодня решил устроить ему настоящий стресс-тест под капотом бесплатного Google Colab и сравнить скорость с обычным Python-пайплайном.

W12

16 мая

Привет! Разработал легковесный гибридный движок для высокоскоростной обработки и квантования массивов данных. Главная фишка — выжать максимум из обычного процессора (CPU) через низкоуровневые векторные инструкции AVX2 на C++20, полностью отказавшись от привязки к CUDA.

Сверху накинул Python-обертку для удобной интеграции в скрипты.

Чтобы не тратить…