Современные требования к инфраструктуре для агентских AI-систем. Развертывание, поддержка и операционные расходы

Агентские AI-системы, которые могут взаимодействовать с окружением посредством сложных интеграций,принимать автономные решения и адекватно реагировать на обратную связь от пользователя, требуют серьезной инфраструктурной поддержки. В этой статье я собираюсь рассмотреть ключевые аспекты развертывания и поддержки таких систем как в облаке, так и на в…

11

Почему лучше начинать новый чат в ChatGPT для каждой темы?

При работе с ChatGPT рекомендуется начинать новый чат для каждой новой темы. Это связано с особенностями обработки информации моделью и влияет на её производительность и точность.

22

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Всем привет! В последнее время я заметил множество постов и статей в русскоязычном сегменте интернета, которые ссылаются на одно интересное исследование, но интерпретируют его… скажем так, довольно своеобразно. Часто можно встретить заголовки вроде «ИИ научился обманывать чтобы спастись!» или «Нейросети вышли из-под контроля и пытались сбежать!». Э…

ML4Room: кто мы

Переводческие технологии, стирающие языковые барьеры<br />
22

Что такое API ChatGPT

Что такое API ChatGPT
11

Как ChatGPT может помочь вам в торговле криптовалютой.

Как ChatGPT может помочь вам в торговле криптовалютой.

Инвестирование в акции с помощью Chatgpt: как использовать ChatGPT для анализа компаний (с подсказками!)

Инвестирование в акции с помощью Chatgpt: как использовать ChatGPT для анализа компаний (с подсказками!)
22

Преимущества Tesla H100 в ML

Меня зовут Руслан, я инженер-программист, автор YouTube канала Ruslan Dev, специализируюсь на облачных вычислениях и машинном обучении. В этом кейсе я расскажу о своем опыте разработки больших языковых моделей (LLM). Так как один из самых передовых графических процессоров Н100 стоит как крыло самолета, я арендовал ее через облачный сервис immers.cl…

22

Почему Llama 3.1 - лучшая открытая нейросеть

В последние месяцы выходит большое количество нейросетей, но только небольшое количество из них заслуживает внимания. Сегодня поговорим о нейросети *Meta Lama 3.1 (признана в РФ экстремистской организацией и запрещена).

22

Какую модель GPT-4 следует использовать? Руководство по GPT-4, GPT-4o и GPT-4o Mini GPT-o1

Какую модель GPT-4 следует использовать? Руководство по GPT-4, GPT-4o и GPT-4o Mini GPT-o1

Llama 3.1 и Mistral Large 2

В прошлом месяце вышли две интересных модели - Llama 3.1, улучшенная версия Llama 3, и Mistral Large 2.

Как я обучил модель, которая понимает русский лучше GPT 3.5 Turbo

Меня зовут Ruslan Dev и в этой статье я расскажу, как я смог обучить модель, которая превзошла GPT 3.5 Turbo на русскоязычной части MT-Bench. Также я рассмотрю новую конфигурацию для обучения на двух графических процессорах параллельно с помощью accelerate и deepspeed.

33
[]