Теория информационного взрыва. Препарируем бизнес-аналитику до феномена больших данных
На самом деле, это и есть «судьба» человека метамодерна: преследовать бесконечно отступающие горизонты
- манифест метамодерниста
Автор слова «парадигма” и по совместительству знаменитой книги о структуре научных революций, Томас Кун подмечал: “Многие головоломки современной нормальной науки не существовали до тех пор, пока не произошла последняя научная революция. Очень немногие из них могут быть прослежены назад к историческим истокам науки, внутри которой они существуют в настоящее время.»
Постоянное увеличение скорости и объёмовпубликаций (объёмаинформации) в масштабахпланеты подарило науке новый вектор исследований, который еще в 1975 получил название информационного взрыва. Картина сегодняшнего дня прибавила в разнообразии красок, но сохранила свой стиль — методы изменились, а проблемы остались и в симбиозе производят себе подобных, нарастая как всё больше походящий на лавину снежный ком. А от переизбытка в количестве неуклонно страдает качество, в особенности субъективное — ценность вычлененного в информационном шуме для отдельно взятого человека или группы людей. Вот и информационная нагрузка становится перегрузкой, и десятки зеттабайтов уже накопленной в мире информации требуют осмысления «масштаба катастрофы».
Тут впору позвать на помощь российского философа и культуролога, Михаила Эпштейна, и его мысль:
“Информационный взрыв таит в себе не меньшую опасность, чем демографический. По Мальтусу, человечество как производитель отстаёт от себя же как потребителя, то есть речь идёт о соотношении совокупной биологической массы и совокупного экономического продукта человечества. Но в состязании с самим собой у человечества всё же гораздо лучшие шансы, чем у индивида в состязании со всем человечеством. Как выясняется к началу третьего тысячелетия, основные ресурсы общества — не промышленные или сельскохозяйственные, но информационные. Если материальное производство человечества отстаёт от его же материальных потребностей, то ещё более отстаёт информационное потребление индивида от информационного производства человечества. Это кризис не перенаселённости, а недопонимания, кризис родовой идентичности. Человечество может себя прокормить — но может ли оно себя понять, охватить разумом индивида то, что создано видовым разумом? Хватит ли человеку биологически отмеренного срока жизни, чтобы стать человеко? ”
В стремлении нагнать пущего ужаса, можно было бы добавить: после выхода на большой экран антинаучно-фантастического боевика Люка Бессона, активно расходился по умам миф об использовании людьми всего лишь 5-ти% своего мозга (а о переосмыслительном фурроре, произведенном на коллективное сознательное трилогией «Матрица» и говорить нечего). Но будем гуманны — миф есть миф. Кто знает, может это и вовсе рояль в кустах, не в последнюю очередь преследующий цели конспирологического оболванивания.
Тут на большой сцене появляется искусственный интеллект, и если человеческий можно в каком-то смысле рассматривать как совокупность побочных проявлений ума, а значит его возможности действительно ограничены физиологически, то возможности интеллекта машины ограничены программно-аппаратно. И на язык высокотехнологичной современности это переводится как «почти не ограничены». Вдобавок к этому, они не на один порядок превосходят возможности человеческого. И это ли не прекрасный инструмент для решения вышеописанных проблем?
Новая форма жизни, электричество 21го века и его нефть
Эти порядком избитые, но справедливые метафоры — фольклор просвещенного общества на тему Big Data, то есть колоссальных объемов неоднородной и быстро поступающей цифровой информации, которые невозможно обработать традиционными инструментами. Технологии их обработки в русскоязычном сегменте подразумеваются под этим же термином. Иерархия тесно связанных понятий в этой области такова: с Big Data работают в Data Science, являющейся в свою очередь одной из областей ИИ наряду с машинным обучением.
Научно-популярные порталы пестрят заявлениями о том, что «большие данные» — это новые возможности для увеличения продаж интернет-магазинов, повышение эффективности логистики, клиентского взаимодействия, конкурентного и b2b-взаимодействия, автоматизация бизнес-процессов и новая система принятия решений. И это действительно так. Big Data раскрывают потенциал компаний, позволяют выдерживать более высокую динамику работы, предлагать продукты и услуги, настолько близкие к клиенту, насколько это возможно (с учетом специфики деятельности компании и рынков ее присутствия).
Преодолев стадию экспериментальных тестирований и выбравшись за пределы академических лабораторий, технологии Big Data стали широко применяться в коммерческом секторе. Но прежде всего Big Data — это значительное технологическое усложнение существующих на рынке решений. Поэтому большие данные применяются там, где классические решения использовать либо невозможно, либо не оптимально. С приходом высоких технологий бизнесу не стало проще. Внедрение «больших данных» рождает ряд сложностей (инфраструктурных, технологических, финансовых), главной из которых остается нехватка специалистов в этой сфере на рынке труда.
Зато стало экономически оправданно переходить на более технологически сложные и дорогие решения. А ещё стало интереснее. У компаний появилось еще одно направление конкуренции, и если компания меньше, но «умнее» и технологичнее, она сможет совершить прорыв и опередить конкурентов. В решении бизнес-задач появилось больше инженерной составляющей, требующей тесного сочетания бизнес-знания и инженерной мысли. При этом применение Big Data дает возможность инновационным компаниям первыми прорубить окно в будущее и первыми ощутить выгоды этого шага.
Большие данные для малого бизнеса
Как ни странно, ничего удивительного в том, что «большие данные» могут здорово помочь индивидуальным предпринимателям, нет. Потому как с их использованием под новым углом раскрывается само понятие клиентоориентированности. Например, обработка данных о предпочтениях постоянных клиентов с последующим применением результатов для повышения качества обслуживания трансформирует малый бизнес и меняет представление людей о нем. Но и это еще не всё. Для малых, средних предприятий и растущего бизнеса Big Data дают независимость от физических инфраструктур, офисов, освобождают от необходимости содержать собственные IT-департаменты и серверные комнаты. Можно больше не заботиться о замене поломанного или устаревшего оборудования, инвентаризациях и удовлетворении запросов IT-штата.
Big Data — Big Brother?
Иногда ты ешь медведя, иногда наоборот- к/ф «Большой Лебовски»
Бытует опасение, что генерация «больших данных» влечет за собой риск утечки персональных данных, дескать все мы на крючке, под колпаком и вообще обрели цифровое бессмертие против своей воли, а это чревато и злонамеренными последствиями в том числе. Проблема в том, что страх этот отчасти оправдан. Чем больше о нас знает компьютер, тем более существенными могут оказаться наши потери, ибо не родился ещё тот программист, что смог бы создать абсолютно защищенную систему. Не существует программно-аппаратного идеала, который было бы невозможно взломать — киберпреступная аксиома очевидности.
И было бы это всё безысходно тоскливо, если б здесь не работало золотое правило клина против клина. А отражается оно в том, что ИИ плотно и весьма успешно используют для целей информационной безопасности, внедряя его в устройства для защиты сетей, баз данных и критической инфраструктуры. Классический пример — SIEM-системы, регистрирующие события в системе. Ещё один канон — системы antifraud, которые в ходе своевременного анализа выявляют отклоняющееся поведение, накапливая данные из множества источников и строя на базе их анализа модели для противостояния злоумышленникам в режиме реального времени. И пусть они тоже не идеальны, гонка кибервооружений между хакерами и специалистами ИБ стимулирует совершенствование боевого арсенала (конечно, как одних, так и других) и стремится к тому, чтобы сделать порог входа в киберпреступность непомерно высоким для оптимальности соотношения усилия/выгода.
Аналитика Big Data в первую очередь может помочь в решении именно этих задач.
Вместо эпилога. На переднем фланге
Мы — команда специалистов аналитического центра 10data, и нам есть что сказать о Data Science. За три года мы завоевали российский рынок разработки в области бизнес-аналитики и продолжаем наращивать позиции, занимаясь делом, которое хотим вывести на передний план цифровизации и просто очень любим. Среди проектов, которыми мы по праву гордимся, были:
- Разработка и внедрение алгоритмов, позволяющих определять степень готовности строительных объектов по фото;
- Разработка авторских предиктивных моделей на базе глубокого обучения для предсказания спроса на лекарственные препараты в аптеках Токио и прогнозирования заболеваемости в Москве на 4 года;
- Разработка веб-приложения для поиска экономически выгодной географической локации в г. Москве для строительства нового медицинского учреждения.