{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Компании эффективно используют только 32% данных

Опрос 1500 сотрудников ИТ-компаний о том, как они используют и хранят данные.

Консалтинговая компания IDC провела исследование Rethink Data по использованию облачных хранилищ при поддержке Seagate Technology — компании, специализирующейся на хранении данных и управлении ими. В нём приняло участие 1500 респондентов, занимающих руководящие должности в ИТ-отделах компаний из США, Канады, Великобритании, Франции, Германии, России, Китая, Тайваня, Японии, Южной Кореи и Австралии.

Проблемы работы с данными: на что жалуются руководители

Опрос ИТ-специалистов показал, что в основном бизнес сталкивается с пятью большими проблемами использования собранных данных (можно было выбрать несколько вариантов ответа):

1. Неспособность использовать полученные данные (39% опрошенных).

2. Неэффективное управление хранимыми данными (37%).

3. Сбор лишь части необходимых данных (36%).

4. Недостаточная безопасность собранных данных (35%).

5. Неравномерная доступность разрозненных баз данных (30%).

Эти проблемы остаются общими для ИТ-инфраструктуры во всём мире, хотя конкретные процентные показатели разнятся в зависимости от страны и региона. Две трети респондентов отмечают недостаточную безопасность данных: её повышение является ключевым вопросом совершенствования систем управления.

Из центра — на периферию

Объёмы данных растут огромными темпами: по прогнозам аналитиков, в ближайшие пару лет прирост будет составлять 42,2% в год. Это легко объяснить ростом населения планеты, стремительной цифровизацией, всё большей популярностью дистанционной работы сотрудников и удалённого управления бизнес-процессами.

32%
всего объёма данных организации активно используют в повседневной работе — остальная информация остаётся без внимания

Во многом это происходит потому, что данные не хранятся централизованно, а распределены между облачными хранилищами и периферийными средами. Соответственно, ими становится сложнее управлять.

С внедрением нейросетей, систем машинного обучения и интернета вещей в разных сферах человеческой жизни и бизнеса, развитием сетей 5G и пользовательских устройств именно на периферии, а не в центре обработки данных, часто происходит принятие рабочих решений в реальном времени. Периферийные компоненты сети могут быть удалены от центра на десятки, а то и сотни километров.

Примеров можно привести множество: это и беспилотная доставка, и платформы по добыче полезных ископаемых, и устройства «умного дома» и «умного офиса», управляемые со смартфона, и производственные площадки на промышленных предприятиях, и многое другое.

По данным опроса Seagate Technology, 30% данных хранится во внутренних центрах обработки, ещё 20% — в сторонних, 19% — в периферийных или удалённых.

На облачные хранилища приходится 22% объёма данных, и лишь 9% хранится в других местах. По прогнозам экспертов, в краткосрочной перспективе это распределение существенно не изменится, и в ближайшие год-два корпоративные среды хранения будут отличаться такой же разрозненностью, как и сейчас.

Объем данных на периферийных объектах растет быстрее: около 36% этой информации после обработки перемещается с периферии в центр, из них порядка 8% — в режиме реального времени. По прогнозам аналитиков Seagate, через два года эти цифры составят 57% и 16% соответственно. Соответственно, возникнет необходимость в централизованном управлении распределенными данными. Более узкие задачи зависят от конкретного типа облаков.

Многооблачная среда, частные и общедоступные облака: достоинства и недостатки

Многие организации хранят данные в общедоступных облачных хранилищах, доступных через интернет (платно или бесплатно) всем желающим. Среди преимуществ этого типа облаков можно отметить:

  • Быстрый рост и масштабирование.
  • Доступность с любого устройства в ИТ-инфраструктуре.
  • Доступ к обширному каталогу служб.

Однако с ростом и развитием деятельности компании такое решение зачастую оказывается недостаточно гибким. Наиболее подходящим вариантом для бизнеса становится использование многооблачных экосистем и комбинированных решений для хранения и управления данными.

Многооблачные системы сочетают общедоступные облака от разных поставщиков с частными, доступными только определённым пользователям. Преимуществами частных облаков являются:

  • Экономия на масштабе под контролем организации.
  • Право собственности на IP-адреса хранилищ для защиты и контроля систем хранения данных.
  • Возможность частого обращения к большим наборам данных.
  • Большая конфиденциальность (что важно, например, для медицинских либо юридических документов).

Также широко применяются так называемые гибридные облака, объединяющие ресурсы частного и общедоступного облака в рамках единой интегрированной инфраструктуры. Это помогает наладить взаимодействие между отдельными хранилищами данных и управлять ими централизованно через единый портал управления. Главную сложность здесь вызывает подключение устаревших систем к общедоступным облакам: в многооблачной среде реализовать эту задачу проще.

Эксперты говорят, что главной сложностью в кратко- и среднесрочной перспективе станет управление корпоративными данными в многооблачных экосистемах и гибридных облаках. И многие управленческие проблемы можно решить благодаря внедрению методологии DataOps, объединяющей создателей и потребителей данных с соответствующими процессами.

Что такое методология DataOps и какую пользу можно из неё извлечь?

DataOps — это методология, ускоряющая модернизацию системы хранения данных и основанная на взаимодействии между их создателями и потребителями. Последними выступают сотрудники компании, отвечающие за организационные вопросы: как правило, это высшее руководство и помогающий ему персонал. Им нужна не исходная информация, а результаты её анализа, которые служат основой для принятия решений.

В качестве создателей данных могут выступать как люди (менеджеры, аналитики, ИТ-специалисты и другие), так и цифровые устройства. При анализе информации нередко возникает вопрос, какие сведения нужно использовать немедленно, а какие отправить на хранение.

Например, если речь идёт об устройстве в ИТ-инфраструктуре, то его технические характеристики могут требовать моментального анализа для координации работы и прогнозов на ближайшее будущее, а сведения о его активности уже передаются в хранилище.

В рамках DataOps широко применяются искусственный интеллект (ИИ) и машинное обучение (МО): эти технологии позволяют устанавливать взаимосвязи между данными из центра, периферии и облачных хранилищ.

Для получения массивов данных используется процесс, в основе которого лежит принцип ELT (Extract, Load, Transform — «извлечение, загрузка, преобразование»). В ходе его работы разрозненные данные из нескольких источников загружаются в единую структуру, которая структурируется и превращается в четкую информацию с помощью ИИ: с ней уже могут работать потребители и принимать решения на её основе.

Главное конкурентное преимущество DataOps — возможность легко устанавливать взаимосвязи между разрозненными данными с помощью единого инструмента. Без DataOps для решения таких задач нужно сразу несколько инструментов, что усложняет и замедляет управление.

Применение DataOps может заметно улучшить бизнес-показатели организаций (прибыль, лояльность клиентов, производительность персонала), что, в свою очередь, приводит к росту конкурентоспособности.

По данным Seagate, лишь 10% опрошенных компаний полностью внедрили у себя DataOps. Наибольший процент (12%) наблюдается в сфере масс-медиа, наименьший (5%) — на производстве. Эффективному использованию методологии препятствуют и технические проблемы, и человеческий фактор (конкуренция между сотрудниками и командами: неготовность персонала к нововведениям). В то же время, большинство опрошенных (89%) считает DataOps важной для развития бизнеса. Лишь 1% опрошенных не придаёт значения методологии.

Самой большой популярностью DataOps пользуется в Китае (процент китайских специалистов, не берущих методологию во внимание, оказывается равен нулю) и Северной Америке (США и Канаде). Особенно высока потребность в ней в транспортной сфере.

Так как опрос проводился ещё в начале 2020 года, до пандемии COVID-19, то можно сделать вывод, что в настоящее время необходимость внедрения DataOps оказывается ещё выше в связи с переходом сотрудников компаний по всему миру на удалённый режим работы (что уже привело к миграции в облачные сервисы). Для России это актуально в первую очередь для крупных городов, характеризующихся развитой ИТ-инфраструктурой и широким распространением «‎облаков».

Грамотное внедрение DataOps способствует созданию и развитию моделей искусственного интеллекта и повсеместного внедрения аналитики данных. Благодаря структурированной аналитической информации компании получают конкурентные преимущества на рынке, наращивают прибыль и делают более эффективным взаимодействие между сотрудниками в разных подразделениях, в том числе географически удалённых друг от друга.

0
14 комментариев
Написать комментарий...
Zuko Yuppi

Я прочитал всю статью и у меня остался только один вопрос:
Для чего компании используют облачные хранилища ? 

Ответить
Развернуть ветку
Alex Ondre

Чтобы скрывать чёрную бухгалтерию на миллиарды рублей, как например компания ООО "Инфо Альянс Системс" расположенная по адресу г. Новосибирск, улица Льва Плотского, 78Г, офис 1828.
ssh для доступа к серверу:
ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABgQC2u/FEJ2QtBcvVd8xaONKt/Zwd83NZokCp8/wBg/6QqB/lvh1tvxGQDLOZHvPqTIO1HDbOdGLevQhzpATV08eYu1KXH3TcygqAubyl7rR60JuGWSyhAoEeX1Zyc78dMS7FY1jeFp3cYpl+J7ISgiU3CzjHg1N5e/sGTyzmaiztxF44Zb0tpDAsi0XTmvfDmquOanZs/HZPbhhN7Zh6xTNluPc361rLR8h2W+INA8zVBg63WN1GfxcHtSu35h/EZkCUl/og595dLoIxRdoPIaF21KZK/5JBYH+xlfwwOnv/v6791PQQCdvXMQfhUM2x13GhtRN30ydqVJNJWwop/6niFEl3hufzcaB1lRaOtdKmg0IXkPaubC5QinpYXJqnkvtST8EAfYPc+ZunQkI0A1nQB4GntPiYndKWprzd6jFVdR1RQKDQEVe9+TdT8bM+r2iRmptD959EN66TybLJSEQSDDKGj3TXAZKlf5oTfYEjI77ABgT70AjLDRpep77UTX0

Ответить
Развернуть ветку
Вадим Клюев

так в хранилище могут проникнуть, взломав, смысл тогда на себя компромах хранить

Ответить
Развернуть ветку
Alex Ondre

Так надо за границей хранить. Там уже пофиг если голландская полиция что-то найдёт.

Ответить
Развернуть ветку
Анна Багаутдинова

😂 я думала, что я одна такая

Ответить
Развернуть ветку
Валентина Сергеенко

Не одна, нас трое, как минимум. 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Трафик Директян

ELT - это экстремально большой телескоп (Extremely Large Telescope). А процесс называется: ETL - сначала извлекаем данные, потом трансформируем и куда-то загружаем

Ответить
Развернуть ветку
Феттучини с Креветкой

Мы еще не простили сигейт за дохлые винты, а тут еще и статьей решили добить. ))

Ответить
Развернуть ветку
Руслан Яцукевич

Тема не раскрыта.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
boj Ko

Полностью согласен с Авторами данной статьи, мало того я  сам участвовал в  разработке и являюсь соавтором нейронки по маркетинговой атрибуции  которая в будущем должна стать гибридной  системой для связки Маркетинга Бизнес аналитики  и CSS за рамками CRM для формирования устойчивой Growth  Strategy на основании накопления данных о ценообразовании на подгруппы спрос и активность просмотров при разных ценовых предложениях как в контекстке поисковиках так и в AMPS (Active Maping Personal Sales)   
Поэтому любая продуктовая или продающая компания должна иметь  свой большой информационный бэкграунд архив, для четкого понимания своего рынка. 

Ответить
Развернуть ветку
Вся соль

А как у меня в ленте на втором месте оказалась статья от 18 ноября? -_-

Ответить
Развернуть ветку
11 комментариев
Раскрывать всегда