Датасет: статьи и новости по теме

18.11.2024

Supervised Fine-Tuning: как настроить LLM под конкретную задачу?

Пожалуй, для адаптации больших языковых моделей (large language model, LLM) под чётко очерченные задачи обработки естественного языка (natural language processing, NLP) нет технологии лучше, чем SFT (supervised fine-tuning). Для дообучения модели её необходимо предварительно обучить, а это означает, что она уже многому научилась из широкого спектра…

Роман Куцев

16.11.2024

Разметка данных в Label Studio при помощи GPT-4: интеграция ML Backend

Роман Куцев

18.11.2024

Как с помощью supervised fine-tuning кастомизировать LLM

В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно обученные LLM (например, семейство GPT) продемонстрировали существенный прогресс в понимании и генерации языка…

Роман Куцев

16.11.2024

Что такое supervised fine-tuning?

Supervised fine-tuning (SFT) — это методика, применяемая для адаптации предварительно обученных Large Language Model (LLM) под конкретную задачу при помощи размеченных данных.

Роман Куцев

12.11.2024

Разметка данных в 2023 году: текущие тренды и требования будущего

Разметка данных и/или аннотирование данных уже давно являются критически важным компонентом многих проектов машинного обучения и ИИ. В последние годы спрос на точную и надёжную разметку данных существенно вырос, ведь этот процесс становится всё более насущным для успеха множества проектов. Что же такое разметка данных? Как она повлияет на бизнесы?…

Роман Куцев

01.10.2024

Пять примеров успешного использования ИИ на производстве

В октябре 2019 года компания Microsoft заявила о том, что искусственный интеллект помогает производственным компаниям обгонять по показателям конкурентов: использующие ИИ производители показывают результаты на 12% лучше, чем их соперники. Поэтому мы скорее всего увидим всплеск применения технологий ИИ на производстве, а также рост новых высокооплач…

Роман Куцев

26.09.2024

Andrej Karpathy: глубокие нейросети 33 года назад и 33 года спустя

На мой взгляд, статья Янна Лекуна с соавторами Backpropagation Applied to Handwritten Zip Code Recognition (1989 год) имеет определённую историческую ценность, поскольку, насколько мне известно, это первое реальное применение нейронной сети, от начала до конца обученной при помощи обратного распространения (backpropagation). Если не учитывать кроше…

Роман Куцев

06.02.2023

20+ популярных опенсорсных датасетов для Computer Vision

ИИ в первую очередь развивается благодаря данным, а не коду.

Роман Куцев

25.11.2022

Опенсорсные массивы данных для Computer Vision

Компания Технологика

18.07.2022

О важности датасета и о том, как сделать его лучше. Наш опыт

Мы подготовили 7 основных шагов, которые превратят набор картинок из гугла не просто в мощный базовый блок системы компьютерного зрения, но и основной инструмент по выявлению и устранению ошибок распознавания.

Яндекс Реклама

24.09.2020

Как контролировать миллионы исполнителей: инструменты и правила «Яндекс.Толоки»

Проблема качества — одна из ключевых в краудсорсинге. Когда работаешь с удалёнными, незнакомыми тебе исполнителями, невозможно угадать, кто возьмёт очередное задание. Достаточно ли он внимателен? Хорошо ли изучил инструкцию? И вообще, это человек или робот? Мы в Яндексе используем краудсорсинг каждый день. Создавать и развивать наши сервисы помогаю…

Цифра

07.05.2020

Открытые источники данных для ИИ в промышленности

Консультант по промышленному интернету вещей и искусственному интеллекту компании “Цифра” Екатерина Ляпина рассказала, как оседлать волну внедрения ИИ, быстро приступить к экспериментам с использованием открытых данных и перейти к полномасштабному внедрению.

Датасет

Supervised Fine-Tuning: как настроить LLM под конкретную задачу?

Разметка данных в Label Studio при помощи GPT-4: интеграция ML Backend

Введение

Как с помощью supervised fine-tuning кастомизировать LLM

Что такое supervised fine-tuning?

Разметка данных в 2023 году: текущие тренды и требования будущего

Пять примеров успешного использования ИИ на производстве

Andrej Karpathy: глубокие нейросети 33 года назад и 33 года спустя

20+ популярных опенсорсных датасетов для Computer Vision

Опенсорсные массивы данных для Computer Vision

Модели Computer Vision, обучаемые на опенсорсных массивах данных

О важности датасета и о том, как сделать его лучше. Наш опыт

Как контролировать миллионы исполнителей: инструменты и правила «Яндекс.Толоки»

Открытые источники данных для ИИ в промышленности