Расшифровка скрытого текста и «говорящая» розетка: лучшие нейронные сети 2020-ого

В этом году действительно сложно подводить итоги в сфере нейросетей — она была очень богата на события в 2020-ом. Но для этой статьи я попытался подобрать лучшие и выдающиеся по моему мнению нейросети уходящего года только с открытым исходным кодом, а в конце поделюсь мыслями о дальнейшем направлении разработок нейросетей и алгоритмов.

Расшифровка скрытого текста и «говорящая» розетка: лучшие нейронные сети 2020-ого

Подборка составлена в произвольном порядке, а всё сказанное в статье — субъективное мнение автора. Если вашей любимой нейросети в списке нет, можете рассказать о ней в комментариях, буду только рад. Также стоит упомянуть, что я никакой не специалист по теме, просто мне интересны современные технологии, включая нейросети. И ещё: я впервые на vc.ru и надеюсь на вашу конструктивную критику, если такая будет.

P.S. Я добавил к каждой нейросети в списке Google Colab (если существует), GitHub и станица проекта для удобства — вдруг захочется самому протестировать или прочитать исследовательскую работу.

Без лишних аннотаций начну с:

Логотип компании OpenAI
Логотип компании OpenAI

Эта нейросеть от OpenAI летом впечатлила многих — она умеет очень реалистично, будто реальный человек, писать или дописывать тексты. Предлагаю вспомнить эту статью, на самом деле полностью написанную нейросетью GPT-3 — тогда даже никто не заметил подвоха, что спровоцировало бурный «всплеск» новостей на тему.

Новое «детище» от OpenAI за полгода успели протестировать по достоинству — разработчики уже использовали её в генерации кода, новостей и статей, и многим понравились результаты. Можете заглянуть на этот сайт, если интересно больше примеров — там подобраны лучшие из лучших. GPT-3 стала одной из самых популярных нейросетей в этом году, и думаю, что заслуженно, качество генерации текста определённо завораживает!

Результаты нейросети «MakeltTalk»

Один из самых забавных алгоритмов года, который умеет создавать анимацию под любую звуковую дорожку — в общем, метод похож на популярную технологию DeepFake, только «на вход» для анимации берётся не видео, а аудио.

У «MakeltTalk», над разработкой которого трудились в Азии, большой спектр использования — например, можно «оживить» розетку или рисунок, а также сделать анимацию лиц Мона Лизы и Эд Ширана.

Результаты нейросети «3d-photo-inpainting»

В этом году много разных исследователей с разных уголков мира представили свои алгоритмы, способные превращать «плоские» изображения в 3D-версии, но своё предпочтение я отдаю именно этому проекту. Качество определённо на уровне — можете посмотреть больше примеров на их странице.

Кстати, с помощью «3d-photo-inpainting» создали целое расширение для Chrome, которое позволяет листать Instagram, в котором все фотографии — в 3D, можете попробовать запустить его у себя, правда говорят, что для этого придётся заморочиться.

Результат нейросети «Self-Supervised Scene De-occlusion»

Эта программа вышла ещё в апреле, с помощью неё можно «разбить» изображение на объекты и «передвигать» их. По-моему наглядно показывает хороший кейс использования нейросетей, способных удалять фон с изображений — только здесь всё немного под другим «углом», ведь фон удаляется частично и только создаётся новый слой. Ну а те, кто тестировали разработку сообщают, что поражены её качеством.

Результат нейросети «Depix»
Результат нейросети «Depix»

А этот алгоритм в отличии от других в статье, представили совсем недавно — в декабре. С помощью нового инструмента можно расшифровывать «пиксельный» текст, необходимо только указать пикселизированное изображение и алфавит, набранный предполагаемым шрифтом в таком же размере.

А после можно увидеть относительно точную догадку, что скрывается за пикселизацией — и результаты одновременно удивляют и пугают, посмотрите сами. Пусть и работает алгоритм с довольно примитивной пикселизацией, многие исследователи говорят, что он всё равно хороший и функцию свою выполняет.

Результаты нейросети «ObstructionRemoval»

«ObstructionRemoval» в свою очередь тоже «навела шуму» в своё время — программа удаляет с изображений преграды (например стекло или решётку). Так это можно использовать в приложениях для обработки фото — у многих пользователей часто бывает, что фотографии вовсе не получаются из-за преграды в снимке.

Правда, многие вскоре отметили, что добиться качественного результата можно только при долгой обработке изображения — изображение с 720p для наилучшего результата будет обрабатываться около получаса. Однако если постоянно совершенствовать нейросеть, наверняка можно добиться неплохого результата.

Результаты нейросети «SkyAR». Советую включить звук!

Этот проект не был бы столь примечательным, если бы его представили не так, как это произошло. Но давайте всё по порядку: нейросеть научили красиво и «динамично» «заменять» небо в видео, к примеру добавлять НЛО, молнии, планеты, дождь или солнце. Можете посмотреть демонстрационное видео проекта, которое с первых секунд впечатляет, а также заглянуть на их страницу, где можно найти ещё больше примеров работы нового инструмента.

Есть ещё очень много нейронных сетей, которые не попали в статью — посмотреть вы их можете в моём Telegram-канале «Not Boring Tech» по хэштегу #Neural_network и по запросам в поиске «нейросеть», «алгоритм». В канале я каждый день пишу простым языком о новых технологиях — включая ИИ, алгоритмы, VR, AR и многом о чём другом. Пользуясь случаем, не мог не порекомендовать его, думаю вам там понравится: t.me/notboring_tech

И судя по разработкам, которые попали в статью лучших нейросетей, можно заметить, что многие алгоритмы были созданы ради эксперимента (например озвучивать розетку будут не для эксперимента?). Многие из них показали себя хорошо, а значит, в 2021 году они могут быть усовершенствованны и разработаны их более лучшие аналоги — в нейронной сфере такое часто бывает. Ну и конечно, в следующем году мир не обойдётся без новых экспериментальных нейроразработок. Возможно и GPT-4 появится?

С наступающим новым годом, успехам всем причастным и не причастным!

2929
8 комментариев

Спасибо за отличную подборку, всегда поражаюсь подобным вещам как ребёнок. Хотя моя жизнь тесно связана с IT, но каждую новую нейросетевую находку воспринимаю как невероятную игрушку.
Подумать страшно, как далеко шагнёт прогресс в ближайшие годы только благодаря изучению нейросетей!

7
Ответить

Круто, спасибо!

Я бы еще отметил MuZero, ворвавшуюся прямо под конец года

4
Ответить

На самом деле, ей уже больше года... Но массово заговорили про нее почему-то только сейчас.
Пруф: https://arxiv.org/abs/1911.08265

Я сам начал экспериментировать с ней после этой статьи, датированной декабрём 2019:
https://medium.com/applied-data-science/how-to-build-your-own-muzero-in-python-f77d5718061a

PS. С наступившим 🥳🥂🍾

2
Ответить

Спасибо за подборку! 

2
Ответить

Ребят, простите в питоне и нейронах вообще нуб. Я правильно поняла, по ссылкам представлен только код,  затестить сами нейроне нельзя?

1
Ответить

Нейросети протестировать как раз можно с помощью предоставленного кода. На GitHub есть исходный код, который надо запустить у себя самостоятельно, например, на своём ПК (и добавить несколько строчек кода, для этого нужно небольшое знание программирования). А собственно в Google Colab можно ещё проще запустить этот код, даже без навыков программирования и без собственного ПК (хоть на ноуте или смартфоне) — следовать простым инструкциям, нажать там на несколько кнопочек, и... результаты от нейросети готовы!

Надеюсь, мне удалось вам помочь)

Ответить

GPT-4 нового года:

1
Ответить