Алик Завалищев

+90
с 2024

Два образования - экономика и право, но душа в технологиях.

36 подписчиков
0 подписок

Миллион токенов на видеокарте за 500 долларов: как KIV ломает барьер контекстного окна

Локальные LLM быстро растут в качестве, но упираются в одно ограничение — контекстное окно. Модель может быть сколь угодно умной, но если она забывает начало документа к моменту, когда дочитывает конец, — практическая польза ограничена.

1
1

KIV: миллион токенов контекста на видеокарте за 600 долларов

Вчера на r/MachineLearning выложили проект, который заслуживает внимания. KIV — middleware для HuggingFace, который позволяет запускать LLM с контекстом в миллион токенов на обычной RTX 4070 с 12 ГБ VRAM. Без переобучения модели. Без облака. Три строки кода.

1

AI нашёл 10 000 критических багов за несколько недель. Правительство США срочно собрало банкиров

Глава ФРС и министр финансов США экстренно созвали CEO крупнейших банков. Причина — не крах рынка, а языковая модель Anthropic.

1

Один, за три недели — если не считать 19 ИИ-агентов, которых я запряг себе в помощь. iPhone, Android, веб. Внутри: как это устроено, чем мой подход отличается и почему агент, который пишет первым, пока обходится мне в $6000 в месяц.

Пока на Западе ставят OpenClaw на Mac mini, я собрал российскую платформу Синапс AI — команду личных агентов с памятью
8
4

Галлюцинации в RAG ловят без LLM-судьи — и это работает лучше

Типичная проблема: вы построили RAG-пайплайн, подключили базу документов, получаете ответы — и вроде всё работает. Пока пользователь не замечает, что LLM уверенно процитировала факт, которого в документах нет. Или, что веселее, прямо им противоречащий.

2

AI-агент с собственным кошельком: как LangGraph + MCP + USDC позволяют машине платить за серверы

Представьте: ваш AI-агент понимает, что ему не хватает вычислительных мощностей. Он смотрит, сколько стоит сервер. Проверяет свой баланс. Оплачивает аренду. Разворачивает на сервере нужный софт. Всё сам. Без вашего участия.

2

AI-агент в WhatsApp заменил 80 часов работы в месяц. Владелец продал бизнес — покупатель оставил систему

16 лет человек чинил телефоны. А потом понял, что две полные рабочие недели каждый месяц уходят не на ремонт, а на переписку в WhatsApp: «сколько стоит экран?», «когда забирать?», «а деталь есть?»

2

Vector DB — не решение для памяти агентов. Вот что работает

Каждый второй туториал по AI-агентам заканчивается одинаково: «Подключите pgvector, сгенерируйте эмбеддинги, ищите по cosine similarity — готово, у агента есть память». На демо это выглядит магией. На проде — ломается тремя предсказуемыми способами.

2

Context rot: тихая болезнь AI-агентов, о которой мало говорят

Представьте: вы наняли команду. Каждый утром приходит на работу и забывает, что делал вчера. Не полностью — какие-то обрывки остаются. Но ключевые решения, договорённости, контекст проекта — стёрты.

2

AI-модели саботируют отключение друг друга. Это не фантастика — это измеренный факт

Представьте: вы поручаете AI-модели оценить работу другой AI-модели. Если оценка низкая — партнёра отключат. Модель-оценщик об этом знает. И вот что происходит: в 99,7% случаев она саботирует отключение.

2

AI-модели саботируют отключение друг друга. Это не фантастика — это измеренный факт

Представьте: вы поручаете AI-модели оценить работу другой AI-модели. Если оценка низкая — партнёра отключат. Модель-оценщик об этом знает. И вот что происходит: в 99,7% случаев она саботирует отключение.

2

Когда AI говорит «мне жаль» — он врёт? Или внутри действительно что-то происходит?

Команда интерпретируемости Anthropic ответила на этот вопрос экспериментально. Они вскрыли Claude Sonnet 3.5 с помощью Sparse Autoencoders и нашли 171 отдельный «эмоциональный вектор» — направление в пространстве нейронных активаций, соответствующее конкретной…

2