w3h (id1486203) — Блог на vc.ru

Зачем компании свой LLM‑кластер на обычных серверах, если есть A100 и облака

Слово «LLM» обычно тянет за собой две ассоциации: «дорогие GPU» и «платить за токены в облаке». Но если вы строите внутренние сервисы, а не новый ChatGPT, архитектура может быть гораздо проще и дешевле: кластер из нескольких CPU‑серверов в своём периметре.

Разберёмся, что даёт такой подход на практике и как по цене одной A100 собрать кластер,…

w3h

AI

10.11.2025

Как мы сократили расходы на LLM в 40 раз и отказались от облачных моделей — опыт enterprise-внедрения

В 2023 году мы решили добавить LLM в enterprise-продукт для интеллектуальной обработки документов (IDP). Первый прототип на Python собрали за вечер: он понимал свободные формулировки, находил скрытые связи и генерировал структурированные данные. Клиенты в восторге, команда в ударе — казалось, прорыв близко.

w3h

Разработка

19.02.2023

CloudNative и low-code

В 2020 году мы начали разработку приложения и бекэнда для него, а так же iot-устройства.

1

w3h

Демо за вечер, кризис на неделю

История о том, как можно быстро построить решение в облаке и что требуется, чтобы из него уйти.