Thinking Machines Lab бывшего техдиректора OpenAI представила первый продукт — API для дообучения языковых моделей

В том числе больших с «мультиэкспертной» архитектурой.

Мира Мурати. Источник фото: Getty Images
Мира Мурати. Источник фото: Getty Images
  • Бета-версию Tinker будут тестировать в закрытом режиме среди исследователей и разработчиков. Есть лист ожидания. Работает API на Python.
  • Среди моделей, которые сервис поддерживает, — разные версии Qwen 3 от китайской Alibaba и Llama 3.1, 3.2 и 3.3 от запрещённой в России Meta. Все c открытым исходным кодом. Список обещают расширять.
  • Пока доступно дообучение методом LoRA. Вместо изменения всех параметров исходной языковой модели он добавляет компактные надстройки к существующей архитектуре, экономя ресурсы.
  • Для работы нужен набор примеров (рекомендованного объёма нет). Само дообучение проходит в контуре ИИ-инфраструктуры Thinking Machines Lab. Компания сама распределяет ресурсы и следит за отладкой сбоев. Веса дообученной модели можно скачать.
  • Помимо этого, Thinking Machines Lab выпустила библиотеку Tinker Cookbook с готовыми реализациями алгоритмов, которые можно запустить поверх API.
  • На старте сервис бесплатный, но в «последующие недели» стартап введёт плату, которая будет зависеть от использования.
3
6 комментариев