Шуруповёрт из Cyberpunk 2077
Роботы Figure на кухне
Nothing Phone 3a
Робот-человек
Nikola всё
Uber для охраны
iPhone 16e
Смартфон Huawei с 3 экранами
Аниме: Улицы разбитых фонарей

На vc.ru появилась возможность писать комментарии с помощью нейросети

Вместе со Сколтехом мы обучили её на том, что пишут пользователи vc.ru, TJournal и DTF.

На vc.ru появилась возможность писать комментарии с помощью нейросети

Возможно, вы уже заметили, что в комментариях появилась кнопка «Нейротекст»:

На vc.ru появилась возможность писать комментарии с помощью нейросети

Мы несколько недель обучали нейросеть GPT-2 на трёх датасетах: комментариях пользователей vc.ru, TJournal и DTF. Так появился спецпроект «Нейротекст», который может написать или дописать комментарий за вас.

Что такое GPT-2

GPT-2 — это нейронная сеть, которая основана на архитектуре transformers и обучена предсказывать следующее слово в предложении. Оригинальная модель содержит 1,5 млрд параметров и может генерировать длинные тексты, удерживая контекст и отсылаясь к предыдущим событиям в тексте.

Наша модель обученная, например, на комментариях DTF, содержит в себе около 29 миллионов параметров.

Чтобы с нуля обучить нейросеть GPT-2, нужен внушительный объём данных. Комментарии пользователей — хорошая основа:

  • На vc.ru пользователи оставили 1,2 млн уникальных комментариев длиннее 10 символов.
  • На DTF — 3,5 млн.
  • На TJ — 1,8 млн.

Мы выгрузили все комментарии с трёх сайтов — получилось 1,8 Гб текста. Но это сырые данные, которые нельзя было использовать. Поэтому датасеты пришлось отфильтровать: убрать лишние символы и ссылки, исключить комментарии из нескольких символов — скорее всего, ничего хорошего с ними бы не вышло.

Затем каждый датасет разбили на «токены», на которых построены предложения. На их основе нейронная сеть собрала свой словарь. С ним она теперь и будет работать, генерируя комменты за вас.

Тренировка нейросети на каждом датасете заняла пять дней, а делали мы всё на этом звере — Nvidia Quadro RTX 6000.

Денис Ширяев, продакт-менеджер «Комитета»

«Нейротекст» напишет комментарий за вас — но готовьтесь ко всякому

Если вы нажмёте на «Нейротекст», то увидите ещё три кнопки с логотипами изданий. Каждая из них сгенерирует комментарий в стиле пользователей соответствующего сайта.

Нейросеть может написать комментарий с нуля, а может — продолжить начатый вами. Редактировать то, что написал робот, нельзя — мы хотим видеть чистый результат работы «Нейротекста».

В процессе тренировки мы генерировали комментарии для тестов и не могли поверить, насколько осмысленно выглядят некоторые из них. Пару десятков раз даже шли в датасеты, чтобы проверить определённые фразы, но их там не было. То есть нейросеть генерировала всё это с нуля.

Илья Чекальский, технический директор «Комитета»

А можно посмотреть на примеры работы нейросети?

Ещё как.

На vc.ru появилась возможность писать комментарии с помощью нейросети
На vc.ru появилась возможность писать комментарии с помощью нейросети
На vc.ru появилась возможность писать комментарии с помощью нейросети
На vc.ru появилась возможность писать комментарии с помощью нейросети
На vc.ru появилась возможность писать комментарии с помощью нейросети

Как мне понять, что я общаюсь с человеком, а не с роботом

Возле каждого комментария, который сгенерирован нейросетью, будет стоять плашка «Нейротекст». Её цвет покажет, от лица какого издания ответил робот. Часть текста, которую написала нейросеть, будет подчёркнута цветной линией.

На vc.ru появилась возможность писать комментарии с помощью нейросети

Мы знаем, что кому-то такие эксперименты могут показаться вмешательством в размеренную жизнь издания. Поэтому предусмотрели тумблер, который выключает все комментарии робота — вернуть их так же просто.

Мы неплохо повеселились — научиться делать такое же можно в Сколтехе

С помощью нейронок можно делать и более сложные и масштабные проекты. Машинное обучение становится базовым инструментарием во многих сферах — всё не ограничивается Data Science.

Например, в магистратуре Сколтеха Advanced Manufacturing Technologies учат применять нейросети в реальном промышленном производстве. Научные сотрудники вместе со студентами этой программы недавно сделали для автопроизводителя Fiat Chrysler Automobiles проект, который сократил время проектирования деталей с двух с половиной месяцев до пары дней.

На направлении Energy Systems применяют машинное обучение для умной техники. Из простых примеров — нейросеть подбирает идеальные параметры работы кондиционера и обогревателя на ближайшие часы в зависимости от размера и расположения окон, планировки, материалов стен и так далее. А в сфере беспроводных связей — нейросети способны снизить энергопотребление мобильных устройств.

Эксперты Сколтеха рассказали о примерах применения нейросетей в своих проектах в отдельном материале — читайте по ссылке ниже.

Что теперь

Заходите в комментарии и давайте общаться. Теперь не только с людьми, но и с роботами.

Обновление: Эксперимент подошёл к концу. 🤖

8080
613 комментариев

Комментарий недоступен

91

Да, |>возможно это и было ошибкой.

12

Путин |>пару лет назад заявлял, что его жена не хочет рожать, а потом как-то отцу позвонил в полицию, сказал, что на неё не влияет.

12

Лучше бы добавили в список AppStore и Google Play, чтобы можно было пользоваться другими сервисами - тогда приложение выйдет с таким функционалом. Платформа может быть только Яндекс.Деньги, а не кошелек.

6

Вот это |>¯\\_(ツ)_/¯

5

Эти нейротексты как Олег |>считают себя самым умным в комментариях.

5

Комментарий недоступен

3
Раскрывать всегда
Из науки в бизнес — как кандидат технических наук придумал протокол передачи данных и основал свой IT-стартап

Олег Терновой нашел, как применить военную технологию mesh-сетей для гражданского назначения. Вместе с единомышленниками — выходцами из академической среды — ученый основал компанию Ternex. И теперь они обеспечивают Wi-Fi в Алтайском крае и планируют выйти на всероссийский рынок.

Из науки в бизнес — как кандидат технических наук придумал протокол передачи данных и основал свой IT-стартап
2020
1818
44
11
Про награду "Хорошее место" на Яндекс Картах
Про награду "Хорошее место" на Яндекс Картах
33
11
Собирай и лидируй

Современному бизнесу доступны технологические достижения, которые позволяют вести диалог с каждым клиентом, существенно приумножая силу своего бренда и лояльность к товарам и услугам. Но какие именно инструменты помогают в этом?

Собирай и лидируй
«Меня можно ненавидеть, но сказать, что я плохой бизнесмен? Думаю, никто не скажет»: Олег Тиньков — о судьбе «Т-Банка», идее запустить эмигрантский стриминг и бизнесе в политике

Несколько цитат из его интервью журналисту Александру Плющеву.

Тиньков. Кадр из интервью 
55
Субботний самопиар на vc.ru

Делимся в комментах ссылками на свои проекты и комментируем чужие! Площадка для самопрезентации стартапов и пет-проектов 👉 Product Radar

Субботний самопиар на vc.ru
2121
1111
11
11
Как сделать трендовое видео для рилс через нейросеть Kling AI

Как сделать трендовое видео для рилс через нейросеть Kling AI? Узнайте секреты создания вирусного видео рилз и получите советы по увеличению просмотров. Откройте для себя лучшие практики, чтобы ваше видео стало популярным и набрало миллион просмотров. Используйте трендовые идеи и технологии для достижения успеха в мире рилс.

Как сделать трендовое видео для рилс? Захватывающий сюжет, неожиданные моменты и первые 3 секунды решают все
Как мы привлекли 15.000 подписчиков в Telegram для онлайн-школы и окупили бюджет за 3 месяца

Как мы реализовали бюджет в 3 млн. рублей на посевах в Telegram, получили 15.000+ целевых подписчиков и окупили проект за 3 месяца.

Как мы привлекли 15.000 подписчиков в Telegram для онлайн-школы и окупили бюджет за 3 месяца
99
22
11
[]