LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

LG представила нейросеть Captioning AI, которая создаёт текстовые описания для изображений

Одно из подразделений компании LG представило свою инновационную генеративную систему искусственного интеллекта под названием Captioning AI.

Эта система способна распознавать элементы на изображениях и генерировать для них описания и ключевые слова. Польза, которую такая технология может принести, особенно заметна при систематизации больших баз данных фотографий у крупных компаний.

Представители LG AI Research выступили на мероприятии Computer Vision and Pattern Recognition 2023, важнейшей конференции в области компьютерного зрения, которая состоялась в Ванкувере, Канада.

Они сообщили, что сервис Captioning AI основан на разработанной технологии Zero-shot Image Captioning, разработанной исследовательским отделом LG AI Research.

Эта технология позволяет искусственному интеллекту "понимать" и описывать объекты и сцены, которые нейросеть впервые оценивает без дополнительных подсказок, основываясь на своем предыдущем опыте, аналогично работе человеческого восприятия.

Отличительной особенностью этой технологии является то, что она отличается от других ИИ-сервисов, таких как Midjourney, где пользователи вводят текст или загружают изображение, и на основе этого ИИ создает свои собственные творения.

Создание "субтитров" для изображений может показаться простой задачей, так как концепция не нова. Однако эта технология подняла планку на новый уровень.

Искусственный интеллект действительно может делать выводы и описывать то, что он никогда раньше не "видел". Он способен рассмотреть пейзаж или человека и определить конкретное место или объект.

Технология также может распознавать фон, персонажей и даже их активности, а также описывать взаимодействие элементов на изображении.

С помощью Captioning AI можно сгенерировать текстовые описания и ключевые слова для более чем 10 тысяч изображений менее чем за два дня.

Такая высокая скорость генерации позволяет повысить эффективность и продуктивность компаний, которым необходимо обрабатывать большие объемы изображений. В среднем система способна генерировать 5 предложений и 10 ключевых слов за 10 секунд.

Этот сервис разработан при активном сотрудничестве с Shutterstock, ведущей платформой для размещения визуального контента, включая изображения и видео.

LG AI Research ранее уже сотрудничала с этой американской компанией и планирует продолжать расширять свое партнерство с ними, а также искать новые партнерские отношения.

Представители Shutterstock отметили, что технология Captioning AI продолжает развиваться благодаря "раннему доступу" к программе, предоставленному десятью глобальными клиентами.

ChatGPT-бот в Telegram предоставляет простой и бесплатный способ взаимодействия с ИИ, без необходимости регистрации, использования VPN и дополнительных номеров - ССЫЛКА.

Этот бот отличается от других тем, что не требует оплаты за использование и может быть использован в любом количестве - пользуйтесь на здоровье.

Начать дискуссию
Приезжайте к нам в Германию, у нас айтишники живут в коммуналках и пляшут с бубном, чтобы выжить

За 6 лет я успела поработать в трех крупных IT-компаниях, несколько раз меняла жилье и переехала из Мюнхена в Берлин. В статье я расскажу про немецкую бюрократию, налоги и почему даже айтишники с высокими зарплатами живут в коммуналках. А еще, как в Германии искать работу и жилье, сколько стоит здесь жить, как получить медстраховку и как вы можете…

У меня дом 2016 года постройки. Это не лучшее фото фасада — я сделала снимок, чтобы показать последствия новогодних празднований в Берлине. Кто-то запустил фейерверк — квартира сгорела, фасад на несколько этажей закоптился. Но в целом дом чистый и уютный.
3232
33
Знакомый вернулся из Германии после трех лет работы там. Говорит, что не выдержал именно бюрократии и того, что к русским относятся как к людям второго сорта. В статье автор это деликатно обходит, но это реальность.
реклама
разместить
Дональд Трамп снова отложил введение пошлин на товары из Канады и Мексики — до 2 апреля 2025 года

Для Китая исключений не сделали.

Источник: Reuters
66
11
Народное достояние? Увидел где и как добывают золото в России
Народное достояние? Увидел где и как добывают золото в России
«Аэрофлот» запустил в аэропорту Шереметьево стойки для самостоятельной регистрации и сдачи багажа

С помощью них можно сразу зарегистрироваться и на рейс.

Как выглядят стойки для самостоятельной регистрации на рейс и багажа. Источник: Telegram-канал «Аэрофлота»
1616
Так они уже были там давно. С перерывом на 3 года не работали из-за санкций, которые всем на пользу, наверное😂Видимо, импортозместили, наконец
Восьмой запуск Starship: корабль разрушился, но первую ступень вернули на Землю и поймали с помощью манипулятора

Это уже третье успешное использование башни-крана Mechazilla.

1616
11
Что то не ладится там у них. Опытных специалистов дефицит. Если помиримся с ними то надо туда Рогозина отправить на помощь.
🚀 Как россияне инвестируют: предпочтения мужчин и женщин, гендерные отклонения в котировках.
🚀 Как россияне инвестируют: предпочтения мужчин и женщин, гендерные отклонения в котировках.

💼 Сколько россияне готовы инвестировать?

11
ЦБ продлил ограничение на снятие наличной иностранной валюты на полгода — до 9 сентября 2025 года

Из-за санкций против России.

44
22
11
11
[]