Мы выгрузили все комментарии с трёх сайтов — получилось 1,8 Гб текста. Но это сырые данные, которые нельзя было использовать. Поэтому датасеты пришлось отфильтровать: убрать лишние символы и ссылки, исключить комментарии из нескольких символов — скорее всего, ничего хорошего с ними бы не вышло.
Затем каждый датасет разбили на «токены», на которых построены предложения. На их основе нейронная сеть собрала свой словарь. С ним она теперь и будет работать, генерируя комменты за вас.
Тренировка нейросети на каждом датасете заняла пять дней, а делали мы всё на этом звере — Nvidia Quadro RTX 6000.
Комментарий недоступен
Да, |>возможно это и было ошибкой.
Путин |>пару лет назад заявлял, что его жена не хочет рожать, а потом как-то отцу позвонил в полицию, сказал, что на неё не влияет.
Лучше бы добавили в список AppStore и Google Play, чтобы можно было пользоваться другими сервисами - тогда приложение выйдет с таким функционалом. Платформа может быть только Яндекс.Деньги, а не кошелек.
Вот это |>¯\\_(ツ)_/¯
Эти нейротексты как Олег |>считают себя самым умным в комментариях.
Комментарий недоступен