Разметка: статьи и новости по теме

18.11.2024

Supervised Fine-Tuning: как настроить LLM под конкретную задачу?

Пожалуй, для адаптации больших языковых моделей (large language model, LLM) под чётко очерченные задачи обработки естественного языка (natural language processing, NLP) нет технологии лучше, чем SFT (supervised fine-tuning). Для дообучения модели её необходимо предварительно обучить, а это означает, что она уже многому научилась из широкого спектра…

Роман Куцев

18.11.2024

Как с помощью supervised fine-tuning кастомизировать LLM

В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно обученные LLM (например, семейство GPT) продемонстрировали существенный прогресс в понимании и генерации языка…

Роман Куцев

16.11.2024

Что такое supervised fine-tuning?

Supervised fine-tuning (SFT) — это методика, применяемая для адаптации предварительно обученных Large Language Model (LLM) под конкретную задачу при помощи размеченных данных.

Роман Куцев

17.06.2022

Руководство по типам аннотирования изображений

Задаётесь вопросом, какой тип аннотирования изображений лучше всего подойдёт для вашего проекта?

Роман Куцев

06.06.2022

Аннотирование текста для машинного обучения

Несмотря на масштабный переход к цифровым технологиям, часть наиболее сложных данных по-прежнему хранится в виде текста в статьях или официальных документах. В условиях изобилия публично доступной информации возникают трудности с управлением неструктурированными сырыми данными и их преобразования в понятный для машин вид. С текстом это сделать слож…

NTA

07.04.2022

API и ФССП: как это работает?

В рамках профессиональной деятельности у меня часто возникает задача получения данных об исполнительном производстве (ИП) в отношении физических лиц с сайта ФССП.

В принципе на сайте ФССП возможность…

Kseniya Kats

Сервисы

04.12.2019

«Хакни пайплайн»: подведены итоги первого крауд-хакатона

В рамках однодневного интенсива 16 команд искали самое эффективное решение для задачи разметки большого массива данных. В распоряжении участников была функциональность Яндекс.Толоки (построить процесс и получить датасет предстояло именно в Толоке) и реальные данные о товарных позициях маркетплейса OZON — 500 ссылок на карточки товаров.

На OZO…

Слава Шегай

Разработка

15.07.2019

Инструкция: создать и загрузить разметку изображений в новый инструмент Apple для обучения нейросетей Create ML

Перевод материала разработчика IBM Watson Николаса Бурдакоса.