{"id":14274,"url":"\/distributions\/14274\/click?bit=1&hash=fadd1ae2f2e07e0dfe00a9cff0f1f56eecf48fb8ab0df0b0bfa4004b70b3f9e6","title":"\u0427\u0435\u043c \u043c\u0443\u0440\u0430\u0432\u044c\u0438\u043d\u044b\u0435 \u0434\u043e\u0440\u043e\u0436\u043a\u0438 \u043f\u043e\u043c\u043e\u0433\u0430\u044e\u0442 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u0438\u0441\u0442\u0430\u043c?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"6fbf3884-3bcf-55d2-978b-295966d75ee2"}

Кирилл Казаков

19 июн 2018 19.06.2018

Какие выводы я сделал, пытаясь написать статью с помощью искусственного интеллекта Статьи редакции

Конспект истории Пола Форда для Bloomberg.

Пол Форд

О машинном обучении сейчас, похоже, говорит каждый. И всё же, когда меня спрашивают о том, что с ним делает моя компания по разработке ПО, я отвечаю: «Ничего». Ведь на определённом этапе делать с машинным обучением действительно нечего.

Но в случае, например, с Google, Apple, Facebook, Microsoft и Amazon использование инструментов машинного обучения оправдано — в распоряжении этих компаний огромное количество данных, настолько огромное, что человеку не справиться с ним самостоятельно. Тут на помощь и приходит ИИ.

Так вот, любопытство и глубокая лень вперемешку с оптимизмом подтолкнули меня к изучению машинного обучения. Я задумал самостоятельно научить нейронную сеть писать как я, загрузив в неё все свои тексты. Мне, конечно, пришлось попотеть.

Во-первых, разобраться в терминологии оказалось очень непросто — что такое, скажем, рекуррентные нейронные сети и долгая краткосрочная память? Даже мне — привыкшему к жаргону разработчику — было сложно. Что ещё хуже, в машинном обучении задействовано много математики.

Сложившаяся ситуация напомнила мне Linux и сеть в 1990-е годы: перед тобой откроются невероятные возможности, стоит только освоить терминологический язык. Разумеется, осилить его необходимо, ведь технология работает.

А работает она потому, что машинное обучение пишет код за вас. Загружаете данные и на выходе получаете программу для их классификации. Как? Зачастую этогоне знают даже серьёзные разработчики. Не стоит ли в таком случае взять паузу и всё обдумать? Согласится ли на это Кремниевая долина? Думаю, нет.

С другой стороны, машинное обучение — штука очень медленная. Мы привыкли к удивительной быстроте, с которой компьютеры выполняют тысячи задач одновременно. Но когда я попытался скормить программе все свои статьи в надежде, что компьютер напишет за меня хоть пару строк, мой ноутбук словно сказал мне «нет». Чтобы создать модель стилистических особенностей моего письма, потребовалась как минимум ночь. Выходит, пока быстрее написать текст самому.

Но начитавшись различных руководств, я не собирался сдаваться и установил TensorFlow, среду для машинного обучения от Google. В этот раз я решил загрузить в систему встречи из Google Календаря и посмотреть, смогу ли сгенерировать новые, звучащие правдоподобно приглашения.

К сожалению, названия моих встреч и дел довольно однообразны: «подбор кадров», «разработка», «офисные посиделки». Так или иначе, я запустил скрипт, но напутал с настройками, и нейронная сеть постоянно выдавала мне «разработку».

Тем не менее я был горд собой. Сменив настройки, я попробовал снова. А затем ещё раз. И опять. На самом деле я так увлёкся, что пропустил настоящую встречу. Результаты, впрочем, оставляли желать лучшего.

В какой-то момент я решил перенести свои занятия домой, где у меня была мощная видеокарта, но к несчастью, я не смог совместить её с Linux. Однако выход всё равно оставался — я мог арендовать тензорный процессор Google, используя облачные сервисы компании. У Microsoft за $50 в месяц можно получить место на облаке для машинного обучения, Amazon предлагает нечто похожее за пять центов в час.

В итоге вернувшись на работу, я вновь поменял настройки нейронной сети — минимальной единицей обучения стали слова, а не символы, что значительно ускорило процесс. Через 2 тысячи эпох я наконец-то начал получать более-менее понятные ответы и понемногу осознавать, почему все так восхищаются машинным обучением — всегда найдётся что-то, что можно поправить и сделать компьютер более похожим на мыслящее существо. Совершенно удивительно наблюдать за тем, как учится машина.

И всё же спустя 20 тысяч эпох результаты не стали лучше. Я исчерпал свои знания в машинном обучении и сделал несколько выводов:

Мой корпус текстов оказался слишком мал для создания сносной прогнозирующей модели.
Как и любому ПО, инструментам машинного обучения нужен человек, присматривающий за ними и направляющий их поведение. По крайней мере на этом этапе.
Да и зачем вообще напрягаться? У крупных компаний есть люди, данные, ПО. Не хотите платить Google? Переходите на Amazon. Сегодня обучение проходит медленно, а уже завтра любая посудомойка будет учить нейронную сеть лучше мыть тарелки.

Между тем для технологических гигантов потенциал огромен. У Google, скажем, в распоряжении множество данных, которые машинное обучение очень эффективно превращает в большие данные.

Поэтому, будь я Google, в худшем случае я просто воспользуюсь тем, что даёт мне машинное обучение, и усовершенствую свой набор рекламных продуктов, сделав их умнее и полезнее, заодно улучшив поиск на всех платформах и сети в целом. Плюс ко всему, я смогу упростить использование телефонов на Android.

Одновременно с этим я, Google, выпущу общедоступную платформу TensorFlow, и тем самым привлеку большую группу разработчиков, которые просто захотят воспользоваться инфраструктурой и заниматься машинным обучением в серьёзных масштабах. Такой ход поможет обновить инструменты для внутреннего пользования, что с течением времени принесёт ещё много миллиардов долларов.

В самых смелых мечтах я бы запустил совершенно новую линейку продуктов, связанных с машинным зрением, переводом и сервисами автоматической торговли, создав разработки стоимостью в сотни миллиардов долларов — до того как машинное обучение станет дешёвым и доступным.

Я имею в виду следующее: даже если все смогут без проблем заниматься такими вычислениями, у меня останутся данные, за доступ к которым придётся неплохо заплатить. Я бы так и занимался беспилотными машинами, создавал голосовые и почтовые ассистенты, при этом обеспечивая всех вокруг облачной инфраструктурой для машинного обучения, потому как мои инструменты станут стандартом и данных у меня будет больше всех.

Да, на практике появятся определённые неудобства: полиция сможет отслеживать потенциальных преступников, кредитные агентства — ненадёжных заёмщиков и так далее. Но мы будем просто поддерживать инфраструктуру.

В худшем случае, я, Google, стану чрезвычайно успешной компанией, а в лучшем — стану основой для новой цифровой эпохи, где компьютер глубоко интегрирован в нашу жизнь.

#будущее #искусственныйинтеллект

0 показов

3.8K открытий

10 комментариев

Написать комментарий...

Алексей Левин

19.06.2018

А где пример статьи? Или это и есть та самая статья, написанная с помощью ИИ?

Ответить

Развернуть ветку

Кирилл Казаков

19.06.2018 Автор

Нет, у него ничего не вышло и поэтому он залил в нейронную сеть встречи из календаря.

Ответить

Развернуть ветку

Вася Пражкин

19.06.2018

Забавный чувак, имеет компанию по разработке ПО, а в теме Deep Learning он так и не разобрался. Предположу, он даже и не в курсе, чем Machine Learning отличается от Deep Learning(DL). Если бы он потратил хотя бы пару часов на изучение, чем же хорош DL, какие задачи решает, какие входные данные использует и какие результаты можно получить, этой статьи бы не было. Какие-то ушлые маркетологи приплели AI к DL, а по факту там интеллекта как у табуретки, результат определяется алгоритмами обработки данных.

Ответить

Развернуть ветку

Andrey Polyakov

19.06.2018

Чем же они отличаются? Второе есть подмножество первого, так что не очень логично говорить о сходствах и различиях. Ну и к термину "Искусственный интеллект" маркетологи не имеют никакого отношения, термин сложился исторически. Разве что люди далекие от темы слово "интеллект" понимают несколько по-другому. Это просто раздел computer science, включающий в себя машинное обучение, которое, в свою очередь включает в себя глубокое обучение. Так что DL это AI и есть.

Ответить

Развернуть ветку

Вася Пражкин

19.06.2018

DL я бы не назвал подмножеством ML, это скорее следующий этап развития ML. Интеллект "по-другому" понять нельзя, у него довольно четкое определение и текущие работы в AI им не обладают, к моему сожалению. DL есть AI только в умах маркетологов, далеких от технологий, и просто несведущих людей.

Ответить

Развернуть ветку

Andrey Polyakov

19.06.2018

Вы бы не назвали, но индустрия, научное сообщество и простая логика называет. Ваше дело. У машинного обучения так же есть вполне четкое определение и глубокое обучение под него попадает. Тем более, что классические алгоритмы машинного обучения никуда не исчезли и все так же активно применяются, в том числе в связке с нейронными сетями и глубоким обучением. В общеупотребительном смысле, интеллект - качество присущее человеческой психике, в контексте ML, интеллект - способность к обучению. Вот и все.

Ответить

Развернуть ветку

Вася Пражкин

19.06.2018

Сообщество четко записывает DL + AI в одну категорию, отделяя их от ML, посмотрите хотя бы названия профильных конференций:
https://tryolabs.com/blog/machine-learning-deep-learning-conferences/

Словосочетание AI используется для хайпа и потому, что устоялось.

Модели DL(и тем более ML) способны обучаться лишь по очень узкому алгоритму и правилам, что нельзя назвать широким словом "обучение". Корректнее здесь термин "подстраивание". Потому, как модели, натренированные на одних данных порой очень плохо работают с другими данными. Касательно статьи, товарищ вобщем-то не удосужился разобраться в проблеме и даже, похоже, не пытался подстроить модели. В любом случае, для получения хороших результатов требуется подстройка слоев и параметров сети, а также предварительная обработка данных.

Ответить

Развернуть ветку

Andrey Polyakov

19.06.2018

Открываем любую из предложенных вами конференций с названием "машинное обучение" и видим половину докладов по глубокому обучению. Т.е. конференция может называться "Геометрия многообразий" и конференция может называться "Дифференциальная топология", но это не значит, что второе не включает в себя первое.
"Модели DL(и тем более ML) способны обучаться лишь по очень узкому алгоритму и правилам" - ключевая фраза "способны обучаться". И вполне устоявшаяся терминология уже есть. Спорить на эту тему я устал.

Ответить

Развернуть ветку

Impera CMS

19.06.2018

Вывод: не зная брода не суйся в воду. Тем более, выбравшись на берег из тины, не стоит размышлять в стиле "если бы я был Google".

Ответить

Развернуть ветку

Дмитрий Калашников

20.06.2018

//уже завтра любая посудомойка будет учить нейронную сеть лучше мыть тарелки.

Похоже, это новая классика.

"Мы знаем, что любой чернорабочий и любая кухарка не способны сейчас же вступить в управление государством." В. И. Ленин.

Ответить

Развернуть ветку

Написать комментарий...

7 комментариев

Раскрывать всегда