Копейки, говоришь?
Ты представляешь себе железо, которое тебе вместит модель уровня Opus с нужной скоростью генерации?
точно мы не знаем характеристики, но если прикинуть, то один инстанс потребует даже
при оптимальной квантизации и MoE 600-1100GiB VRAM.
в предложенном AWS инстанс на 8H100 будет стоит $39629 в месяц. точно дешевле получится, чем платить за подписку?
Это решается доп. договором и согласием на определенные условия.тогда весь смысл в автомасштабировании теряется. по сути ты предлагаешь заранее оплатить ресурсы. зачем их тогда останавливать?
Но и не забываете про serverless (AWS Bedrock например), где цены на токены зависят от выбранной модели.падажжи, кто там что говорил про "В офисе или собственном ЦОДе." ? вот мы уже до Bedrock дошли в обсуждении твоими стараниями. так о чём тогда речь? тогда можно и платить дальше Антропику с таким подходом
Ты не видишь чтоль "No availability"?
Привет тебе от рыночка 5
Привет тебе от рыночка 4
Привет тебе от рыночка 3
Привет тебе от рыночка 2
Привет тебе от рыночка 1
Во-первых, в "нехреновом" цены будут в 3-6 раз выше.
Во-вторых, там, в AWS/GCP, тоже запросто даже при наличии квоты не будет нужных ресурсов ни в одном регионе в нужный тебе момент, если ты ищешь h100+
да ты просто совсем не шаришь. я тебе показываю, что отсутствие ресурсов -- не особенность конкретного поставщика, а общая ситуация сейчас на рынке. а ты даже такой простой факт не можешь понять