Компании эффективно используют только 32% данных
Опрос 1500 сотрудников ИТ-компаний о том, как они используют и хранят данные.
Консалтинговая компания IDC провела исследование Rethink Data по использованию облачных хранилищ при поддержке Seagate Technology — компании, специализирующейся на хранении данных и управлении ими. В нём приняло участие 1500 респондентов, занимающих руководящие должности в ИТ-отделах компаний из США, Канады, Великобритании, Франции, Германии, России, Китая, Тайваня, Японии, Южной Кореи и Австралии.
Проблемы работы с данными: на что жалуются руководители
Опрос ИТ-специалистов показал, что в основном бизнес сталкивается с пятью большими проблемами использования собранных данных (можно было выбрать несколько вариантов ответа):
1. Неспособность использовать полученные данные (39% опрошенных).
2. Неэффективное управление хранимыми данными (37%).
3. Сбор лишь части необходимых данных (36%).
4. Недостаточная безопасность собранных данных (35%).
5. Неравномерная доступность разрозненных баз данных (30%).
Эти проблемы остаются общими для ИТ-инфраструктуры во всём мире, хотя конкретные процентные показатели разнятся в зависимости от страны и региона. Две трети респондентов отмечают недостаточную безопасность данных: её повышение является ключевым вопросом совершенствования систем управления.
Из центра — на периферию
Объёмы данных растут огромными темпами: по прогнозам аналитиков, в ближайшие пару лет прирост будет составлять 42,2% в год. Это легко объяснить ростом населения планеты, стремительной цифровизацией, всё большей популярностью дистанционной работы сотрудников и удалённого управления бизнес-процессами.
Во многом это происходит потому, что данные не хранятся централизованно, а распределены между облачными хранилищами и периферийными средами. Соответственно, ими становится сложнее управлять.
С внедрением нейросетей, систем машинного обучения и интернета вещей в разных сферах человеческой жизни и бизнеса, развитием сетей 5G и пользовательских устройств именно на периферии, а не в центре обработки данных, часто происходит принятие рабочих решений в реальном времени. Периферийные компоненты сети могут быть удалены от центра на десятки, а то и сотни километров.
Примеров можно привести множество: это и беспилотная доставка, и платформы по добыче полезных ископаемых, и устройства «умного дома» и «умного офиса», управляемые со смартфона, и производственные площадки на промышленных предприятиях, и многое другое.
На облачные хранилища приходится 22% объёма данных, и лишь 9% хранится в других местах. По прогнозам экспертов, в краткосрочной перспективе это распределение существенно не изменится, и в ближайшие год-два корпоративные среды хранения будут отличаться такой же разрозненностью, как и сейчас.
Объем данных на периферийных объектах растет быстрее: около 36% этой информации после обработки перемещается с периферии в центр, из них порядка 8% — в режиме реального времени. По прогнозам аналитиков Seagate, через два года эти цифры составят 57% и 16% соответственно. Соответственно, возникнет необходимость в централизованном управлении распределенными данными. Более узкие задачи зависят от конкретного типа облаков.
Многооблачная среда, частные и общедоступные облака: достоинства и недостатки
Многие организации хранят данные в общедоступных облачных хранилищах, доступных через интернет (платно или бесплатно) всем желающим. Среди преимуществ этого типа облаков можно отметить:
- Быстрый рост и масштабирование.
- Доступность с любого устройства в ИТ-инфраструктуре.
- Доступ к обширному каталогу служб.
Однако с ростом и развитием деятельности компании такое решение зачастую оказывается недостаточно гибким. Наиболее подходящим вариантом для бизнеса становится использование многооблачных экосистем и комбинированных решений для хранения и управления данными.
Многооблачные системы сочетают общедоступные облака от разных поставщиков с частными, доступными только определённым пользователям. Преимуществами частных облаков являются:
- Экономия на масштабе под контролем организации.
- Право собственности на IP-адреса хранилищ для защиты и контроля систем хранения данных.
- Возможность частого обращения к большим наборам данных.
- Большая конфиденциальность (что важно, например, для медицинских либо юридических документов).
Также широко применяются так называемые гибридные облака, объединяющие ресурсы частного и общедоступного облака в рамках единой интегрированной инфраструктуры. Это помогает наладить взаимодействие между отдельными хранилищами данных и управлять ими централизованно через единый портал управления. Главную сложность здесь вызывает подключение устаревших систем к общедоступным облакам: в многооблачной среде реализовать эту задачу проще.
Эксперты говорят, что главной сложностью в кратко- и среднесрочной перспективе станет управление корпоративными данными в многооблачных экосистемах и гибридных облаках. И многие управленческие проблемы можно решить благодаря внедрению методологии DataOps, объединяющей создателей и потребителей данных с соответствующими процессами.
Что такое методология DataOps и какую пользу можно из неё извлечь?
DataOps — это методология, ускоряющая модернизацию системы хранения данных и основанная на взаимодействии между их создателями и потребителями. Последними выступают сотрудники компании, отвечающие за организационные вопросы: как правило, это высшее руководство и помогающий ему персонал. Им нужна не исходная информация, а результаты её анализа, которые служат основой для принятия решений.
В качестве создателей данных могут выступать как люди (менеджеры, аналитики, ИТ-специалисты и другие), так и цифровые устройства. При анализе информации нередко возникает вопрос, какие сведения нужно использовать немедленно, а какие отправить на хранение.
Например, если речь идёт об устройстве в ИТ-инфраструктуре, то его технические характеристики могут требовать моментального анализа для координации работы и прогнозов на ближайшее будущее, а сведения о его активности уже передаются в хранилище.
В рамках DataOps широко применяются искусственный интеллект (ИИ) и машинное обучение (МО): эти технологии позволяют устанавливать взаимосвязи между данными из центра, периферии и облачных хранилищ.
Для получения массивов данных используется процесс, в основе которого лежит принцип ELT (Extract, Load, Transform — «извлечение, загрузка, преобразование»). В ходе его работы разрозненные данные из нескольких источников загружаются в единую структуру, которая структурируется и превращается в четкую информацию с помощью ИИ: с ней уже могут работать потребители и принимать решения на её основе.
Главное конкурентное преимущество DataOps — возможность легко устанавливать взаимосвязи между разрозненными данными с помощью единого инструмента. Без DataOps для решения таких задач нужно сразу несколько инструментов, что усложняет и замедляет управление.
Применение DataOps может заметно улучшить бизнес-показатели организаций (прибыль, лояльность клиентов, производительность персонала), что, в свою очередь, приводит к росту конкурентоспособности.
По данным Seagate, лишь 10% опрошенных компаний полностью внедрили у себя DataOps. Наибольший процент (12%) наблюдается в сфере масс-медиа, наименьший (5%) — на производстве. Эффективному использованию методологии препятствуют и технические проблемы, и человеческий фактор (конкуренция между сотрудниками и командами: неготовность персонала к нововведениям). В то же время, большинство опрошенных (89%) считает DataOps важной для развития бизнеса. Лишь 1% опрошенных не придаёт значения методологии.
Самой большой популярностью DataOps пользуется в Китае (процент китайских специалистов, не берущих методологию во внимание, оказывается равен нулю) и Северной Америке (США и Канаде). Особенно высока потребность в ней в транспортной сфере.
Так как опрос проводился ещё в начале 2020 года, до пандемии COVID-19, то можно сделать вывод, что в настоящее время необходимость внедрения DataOps оказывается ещё выше в связи с переходом сотрудников компаний по всему миру на удалённый режим работы (что уже привело к миграции в облачные сервисы). Для России это актуально в первую очередь для крупных городов, характеризующихся развитой ИТ-инфраструктурой и широким распространением «облаков».
Грамотное внедрение DataOps способствует созданию и развитию моделей искусственного интеллекта и повсеместного внедрения аналитики данных. Благодаря структурированной аналитической информации компании получают конкурентные преимущества на рынке, наращивают прибыль и делают более эффективным взаимодействие между сотрудниками в разных подразделениях, в том числе географически удалённых друг от друга.
Я прочитал всю статью и у меня остался только один вопрос:
Для чего компании используют облачные хранилища ?
Чтобы скрывать чёрную бухгалтерию на миллиарды рублей, как например компания ООО "Инфо Альянс Системс" расположенная по адресу г. Новосибирск, улица Льва Плотского, 78Г, офис 1828.
ssh для доступа к серверу:
ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABgQC2u/FEJ2QtBcvVd8xaONKt/Zwd83NZokCp8/wBg/6QqB/lvh1tvxGQDLOZHvPqTIO1HDbOdGLevQhzpATV08eYu1KXH3TcygqAubyl7rR60JuGWSyhAoEeX1Zyc78dMS7FY1jeFp3cYpl+J7ISgiU3CzjHg1N5e/sGTyzmaiztxF44Zb0tpDAsi0XTmvfDmquOanZs/HZPbhhN7Zh6xTNluPc361rLR8h2W+INA8zVBg63WN1GfxcHtSu35h/EZkCUl/og595dLoIxRdoPIaF21KZK/5JBYH+xlfwwOnv/v6791PQQCdvXMQfhUM2x13GhtRN30ydqVJNJWwop/6niFEl3hufzcaB1lRaOtdKmg0IXkPaubC5QinpYXJqnkvtST8EAfYPc+ZunQkI0A1nQB4GntPiYndKWprzd6jFVdR1RQKDQEVe9+TdT8bM+r2iRmptD959EN66TybLJSEQSDDKGj3TXAZKlf5oTfYEjI77ABgT70AjLDRpep77UTX0
так в хранилище могут проникнуть, взломав, смысл тогда на себя компромах хранить
Так надо за границей хранить. Там уже пофиг если голландская полиция что-то найдёт.
😂 я думала, что я одна такая
Не одна, нас трое, как минимум.
Комментарий недоступен
ELT - это экстремально большой телескоп (Extremely Large Telescope). А процесс называется: ETL - сначала извлекаем данные, потом трансформируем и куда-то загружаем
Мы еще не простили сигейт за дохлые винты, а тут еще и статьей решили добить. ))
Тема не раскрыта.
Комментарий недоступен
Комментарий недоступен
Полностью согласен с Авторами данной статьи, мало того я сам участвовал в разработке и являюсь соавтором нейронки по маркетинговой атрибуции которая в будущем должна стать гибридной системой для связки Маркетинга Бизнес аналитики и CSS за рамками CRM для формирования устойчивой Growth Strategy на основании накопления данных о ценообразовании на подгруппы спрос и активность просмотров при разных ценовых предложениях как в контекстке поисковиках так и в AMPS (Active Maping Personal Sales)
Поэтому любая продуктовая или продающая компания должна иметь свой большой информационный бэкграунд архив, для четкого понимания своего рынка.
А как у меня в ленте на втором месте оказалась статья от 18 ноября? -_-