Fine-tuning больших языковых моделей в 2024 году

Fine-tuning больших языковых моделей в 2024 году

Не секрет, что большие языковые модели (LLM) эволюционируют с безумной скоростью и привлекают внимание всей отрасли генеративного ИИ. Корпорации не просто заинтригованы, они одержимы LLM, и в частности, потенциалом fine-tuning LLM. В исследования и разработку LLM сейчас вкладываются миллиарды долларов. Лидеры отрасли и энтузиасты технологий всё сил…

9 лучших инструментов аннотирования изображений для Computer Vision

9 лучших инструментов аннотирования изображений для Computer Vision

Руководство по аутсорсингу разметки данных для машинного обучения

Руководство по аутсорсингу разметки данных для машинного обучения

Разметка данных: бизнес на миллиарды долларов, лежащий в основе прогресса AI

Разметка данных: бизнес на миллиарды долларов, лежащий в основе прогресса AI

Искусственный интеллект: Нейросети, Машинное обучение и Новые Горизонты

Искусственный интеллект (ИИ) стремительно изменяет наше будущее. Все чаще мы сталкиваемся с такими терминами, как нейросети, машинное обучение, deep learning, и, конечно, с самыми продвинутыми моделями вроде GPT-4, созданными OpenAI. Поговорим о том, как ИИ проникает в повседневную жизнь и меняет отрасли, от генерации искусственных изображений до а…

Как дообучать LLM с помощью Supervised Fine-Tuning

Как дообучать LLM с помощью Supervised Fine-Tuning
11

8 инструментов для аннотирования изображений в 2023 году

8 инструментов для аннотирования изображений в 2023 году

Как аннотировать документы для обучения ИИ распознавания текста

Как аннотировать документы для обучения ИИ распознавания текста

Лучшие ИИ-инструменты для аннотирования видео в 2023 году

Лучшие ИИ-инструменты для аннотирования видео в 2023 году

Шесть шагов для создания более качественных моделей Computer Vision

Шесть шагов для создания более качественных моделей Computer Vision

Как опенсорсные инструменты замедляют разработку моделей для анализа медицинских снимков

Как опенсорсные инструменты замедляют разработку моделей для анализа медицинских снимков
11

Самое важное с конференции NeurIPS 2021

Самое важное с конференции NeurIPS 2021
33

Хотите усовершенствовать цикл обработки данных? Попробуйте задействовать людей

Хотите усовершенствовать цикл обработки данных? Попробуйте задействовать людей
11

Десять лучших опенсорсных инструментов аннотирования 2021 года для Computer Vision

Десять лучших опенсорсных инструментов аннотирования 2021 года для Computer Vision
55

Если вы устраняете систематическую ошибку модели, то уже слишком поздно

Если вы устраняете систематическую ошибку модели, то уже слишком поздно
33

Как мы масштабируем машинное обучение

Как мы масштабируем машинное обучение
11

20+ популярных опенсорсных датасетов для Computer Vision

20+ популярных опенсорсных датасетов для Computer Vision
22

Датацентрический и моделецентрический подходы в машинном обучении

Датацентрический и моделецентрический подходы в машинном обучении
11

ML и консенсус между людьми: берём от обоих подходов лучшее

ML и консенсус между людьми: берём от обоих подходов лучшее

Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных

Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных

Как за неделю разметить миллион примеров данных

Как за неделю разметить миллион примеров данных
22

Как избавиться от проблем при разметке данных для обучения ML моделей?

Как избавиться от проблем при разметке данных для обучения ML моделей?

Как создать эффективный план разметки данных?

Как создать эффективный план разметки данных?

Зачем вам нужно использовать активное обучение при обучении нейронных сетей

Зачем вам нужно использовать активное обучение при обучении нейронных сетей

Четыре урока о создании инструментов для машинного обучения

Четыре урока о создании инструментов для машинного обучения
11

Разметка данных для машинного обучения: обзор рынка, методики и компании

Большая доля data science и машинного обучения зависит от чистых и корректных источников данных, поэтому неудивительно, что скорость роста рынка разметки данных продолжает увеличиваться. В этой статье мы расскажем о многих крупных игроках отрасли, а также об используемых ими методиках, чтобы вы могли иметь возможность выбора наилучшего партнёра в с…

Почему я изменил своё мнение о слабой разметке для ML

Почему я изменил своё мнение о слабой разметке для ML

Как Hasty использует автоматизацию и быструю обратную связь для обучения моделей ИИ

<i>CEO Hasty Тристан Руиллар (в центре), сооснователи компании Константин Проскудин (слева) и Александр Веннман (справа)</i>
11

Руководство по типам аннотирования изображений

Руководство по типам аннотирования изображений

Лучшие платформы аннотирования изображений для компьютерного зрения на 2019 год

Лучшие платформы аннотирования изображений для компьютерного зрения на 2019 год

Почему при разработке ИИ главное — это данные

Системы машинного обучения рождаются от союза кода и данных. Код сообщает, как машина должна учиться, а данные обучения включают в себя то, чему нужно учиться. Научные круги в основном занимаются способами улучшения алгоритмов обучения. Однако когда дело доходит до создания практических систем ИИ, набор данных, на котором выполняется обучение, по к…

Почему при разработке ИИ главное — это данные
33

Аннотирование текста для машинного обучения

Аннотирование текста для машинного обучения
33

Пять альтернатив Scale AI

Выбор подходящего инструмента для аннотирования данных — непростая задача, поэтому чтобы принять верное решение, необходимо знать все возможные варианты. В этой статье мы расскажем о лучших, по нашему мнению, альтернативах Scale AI.

11

Лучшие инструменты разметки изображений для компьютерного зрения 2020 года

Лучшие инструменты разметки изображений для компьютерного зрения 2020 года

Лучшие инструменты аннотирования для компьютерного зрения в 2021 году

Лучшие инструменты аннотирования для компьютерного зрения в 2021 году
88

6 правил по обеспечению качества данных для машинного обучения

«Качество — это не действие, а привычка», — сказал великий древнегреческий философ Аристотель. Эта идея справедлива сегодня так же, как и более двух тысяч лет назад. Однако качества добиться не так легко, особенно когда дело касается данных и технологий наподобие искусственного интеллекта (ИИ) и машинного обучения.

6 правил по обеспечению качества данных для машинного обучения

7 способов получить качественные размеченные данные для машинного обучения

Наличие размеченных данных необходимо для машинного обучения, но получение таких данных — непростая и дорогостоящая задача. Мы рассмотрим семь способов их сбора, в том числе перепрофилирование, поиск бесплатных источников, многократное обучение на данных с постепенно повышающимся качеством, а также другие способы.

Топ-5 инструментов для разметки данных в 2021 году

Программы для разметки данных (data labeling) необходимы для прокачки машинного обучения и создания обучающих наборов данных. Поэтому мы решили изучить наилучшие решения из этой области, имеющиеся сегодня на рынке.

12 лучших инструментов аннотирования изображений на 2023 год

12 лучших инструментов аннотирования изображений на 2023 год