Jack Brown

+5022
с 2022
2 подписчика
0 подписок

да ты просто совсем не шаришь. я тебе показываю, что отсутствие ресурсов -- не особенность конкретного поставщика, а общая ситуация сейчас на рынке. а ты даже такой простой факт не можешь понять

1

Копейки, говоришь?

Ты представляешь себе железо, которое тебе вместит модель уровня Opus с нужной скоростью генерации?

точно мы не знаем характеристики, но если прикинуть, то один инстанс потребует даже
при оптимальной квантизации и MoE 600-1100GiB VRAM.

в предложенном AWS инстанс на 8H100 будет стоит $39629 в месяц. точно дешевле получится, чем платить за подписку?

1

Это решается доп. договором и согласием на определенные условия.тогда весь смысл в автомасштабировании теряется. по сути ты предлагаешь заранее оплатить ресурсы. зачем их тогда останавливать?

Но и не забываете про serverless (AWS Bedrock например), где цены на токены зависят от выбранной модели.падажжи, кто там что говорил про "В офисе или собственном ЦОДе." ? вот мы уже до Bedrock дошли в обсуждении твоими стараниями. так о чём тогда речь? тогда можно и платить дальше Антропику с таким подходом

Во-первых, в "нехреновом" цены будут в 3-6 раз выше.
Во-вторых, там, в AWS/GCP, тоже запросто даже при наличии квоты не будет нужных ресурсов ни в одном регионе в нужный тебе момент, если ты ищешь h100+