S-LoRA: методология для дополнительного обучения больших моделей

Недавняя разработка исследователей из Университета Калифорнии, Беркли, и Стэнфордского университета представляет собой решение проблемы ограничений памяти в больших моделях, результаты исследования в их публикации тут, а адепты нейросетей подготовили краткое описание сути проблемы и её решение.

Стоимость обучения и эксплуатации крупномасштабных моделей искусственного интеллекта, имеющих миллиарды параметров, очень высока. А адаптация таких моделей под конкретные требования только усиливает эту проблематику.

Метод адаптации на основе низкоранговой модификации (LoRA) обеспечивает возможность обучения дополнительного набора параметров, которые могут быть интегрированы с первоначальными параметрами модели или использованы отдельно для вывода результатов. Это дает возможность создавать специализированные модули для определенных задач. Однако возникают сложности, связанные с ограниченной памятью видеокарт, которые ограничивают количество возможных адаптеров LoRA и усложняют обработку множественных запросов одновременно.

Решением этих проблем является инновационный подход S-LoRA, который включает в себя:

- Загрузку параметров адаптеров в оперативную память (RAM).
- Перенаправление запросов от графических процессоров (GPU), где размещена основная модель, к соответствующим адаптерам на центральном процессоре (CPU), тем самым освобождая память видеокарты.
- Поддержку одновременной работы с до 2 000 адаптеров.

Этот метод открывает перспективы для дополнительного обучения моделей, даже для организаций, не имеющих таких ресурсов, как крупные технологические компании, например, Google, которые способны обучать модели в полном объеме.

В ближайшем будущем это позволит всем владеть собственным высокоспециализированным ассистентом, способным выполнять разнообразные задачи, используя одну базовую модель.

🔵 Наш Telegram

🔴 Наш YouTube

🟣 Наш VC

S-LoRA: методология для дополнительного обучения больших моделей

Ещё больше важных и интересных новостей про AI на других ресурсах: