Меня зовут Руслан, я инженер-программист, автор YouTube канала Ruslan Dev, специализируюсь на облачных вычислениях и машинном обучении. В этом кейсе я расскажу о своем опыте разработки больших языковых моделей (LLM). Так как один из самых передовых графических процессоров Н100 стоит как крыло самолета, я арендовал ее через облачный сервис immers.cl…
В последние месяцы выходит большое количество нейросетей, но только небольшое количество из них заслуживает внимания. Сегодня поговорим о нейросети *Meta Lama 3.1 (признана в РФ экстремистской организацией и запрещена).
В прошлом месяце вышли две интересных модели - Llama 3.1, улучшенная версия Llama 3, и Mistral Large 2.
Меня зовут Ruslan Dev и в этой статье я расскажу, как я смог обучить модель, которая превзошла GPT 3.5 Turbo на русскоязычной части MT-Bench. Также я рассмотрю новую конфигурацию для обучения на двух графических процессорах параллельно с помощью accelerate и deepspeed.
Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.
Мы в Sixhands тестим GPT-4 и выясняем, можем ли мы наконец стать лидами и просто корректировать ИИ, а не джунов. Еще в обзоре расскажем, что нового появилось и кому радоваться выходу этой версии.
Кто победит между ChatGPT и Bing Chat? Это жаркая битва, но два чат-бота с искусственным интеллектом имеют больше общего, чем вы могли подумать.
Всем привет! Меня зовут Владислав Гусев, я руковожу веб-студией guscom и хочу поделиться с вами моим опытом. Сегодня мы поговорим о довольно интересной и новой теме – об использовании нового приложения ChatGPT Web с генерацией изображений.