Пять впечатляющих цифр о больших данных за 2022 год

Рынок больших данных ежегодно растет на 13,4%, а значит, что к 2029 году он увеличится до 655,53 миллиарда долларов с 271,83 миллиарда долларов в 2022 году. Эта оценка экспертов Fortune Business Insights говорит о том, что big data приносит много пользы брендам и простым пользователям. Однако при таком быстром росте рынка большой объем информации остается нетронутым.

Каждый из нас ежедневно взаимодействует с big data, даже если сам этого не подозревает. Алгоритмы социальных сетей и рекламные предложения, мессенджеры и маркетплейсы, давно привычные мобильные сервисы — именно большие данные делают их такими, которыми мы их знаем.

Содержание:

Пять впечатляющих цифр о больших данных за 2022 год

1. На вторую страницу поиска Google заходит лишь 0,63% пользователей

(Источник: Backlinko)

Поисковые системы вроде Google и Яндекс обрабатывают огромные объемы данных. По данным SimilarWeb, на крупнейшего в мире игрока рынка Google приходится свыше 86,3 миллиардов поисковых запросов каждый месяц. Это чуть больше 8,5 миллиардов запросов в день или почти 99 тысяч в секунду.

Google можно считать абсолютным монополистом на мировом рынке поисковых систем. Его доля на рынке составила 92,34%, по статистике на октябрь 2022 года. К сравнению, Bing, вторая по популярности поисковая система, обрабатывает только 3,59% запросов, а Yahoo — всего лишь 1,31%. Меньше одного процента мирового рынка занимают Яндекс (0,82%), DuckDuckGo (0,61%) и Baidu (0,58%).

Несмотря на большие объемы собираемых данных, большинство пользователей не заходят дальше первой десятки поисковика. Первое место в выдаче собирает аж 27,6% всего трафика, а на сайты со второй страницы кликает лишь 0,63% пользователей. Понятно, что далеко не все бренды готовы к подобной конкуренции. Поэтому компании все меньше полагаются на SEO и все больше на cookieless-решения.

Также пользователи, которые стремятся сохранять конфиденциальность своих данных, стали в разы чаще выбирать анонимные поисковики. Пока что они не составляют ощутимой конкуренции крупным игрокам, но уже вполне могут создавать угрозу привычной модели обработки информации. Если так продолжится и дальше, то уже в ближайшем будущем в этой сфере можно ожидать серьезных изменений.

Пять впечатляющих цифр о больших данных за 2022 год

«Кладбище» Google растет огромными темпами, даже с учетом того, что сайты собирают мизерный органический трафик или не получают его вообще. Специалисты Google и многие сторонние компании думают, как это изменить. Если у вас есть собственные крутые идеи, как это сделать — пишите в комментарии.

2. Пользователи WhatsApp ежедневно отправляют больше 100 миллиардов сообщений

(Источник: Statista)

WhatsApp — это самое популярное и самое скачиваемое приложение для обмена сообщениями во всем мире. По данным на июнь 2022 года, у приложения насчитывается больше 2,26 миллиардов активных пользователей во всем мире. И число продолжает расти. За один месяц аудитория WhatsApp увеличивается на 45 миллионов. Это самый высокий показатель из всех мессенджеров и даже Facebook* Messenger и Telegram не могут с ним конкурировать.

В чем заключается такая популярность? Одна из главных причин — WhatsApp активно продвигали в Индии и сделали очень мощный упор на индийский рынок. В стране насчитывается уже больше 390 миллионов пользователей, прирост которых достигает 16% в год. Разработчики сделали WhatsApp идеальным именно для индийцев — приложение локализовали на десять самых распространенных в Индии языков.

Всего WhatsApp доступен на 40 языках для iOS и на 60 — для Android. Им пользуются в 180 из 195 стран мира.

По данным декабря 2020 года, количество сообщений в WhatsApp, которые отправляют пользователи, превысило 100 миллиардов. К сожалению, новых официальных и подтвержденных данных нет, но если учесть динамику развития, то осенью 2022 года это число уже должно достичь 160 миллиардов.

Объемы сохраняемой информации продолжают набирать обороты, даже несмотря на возможность удалить отправленное сообщение или чат целиком, но все данные остаются на серверах. Правда, по словам компании, всего 30 дней. Но даже так количество сообщений-призраков может достигать десятков миллиардов, и они продолжают занимать место на серверах компании.

При этом данные не лежат мертвым грузом. Они анализируются как big data и часто используются для создания персонифицированных рекламных портретов. Человек получает бесплатный доступ к сервисам и услугам крупной компании, а взамен жертвует частичкой собственной конфиденциальности. Некоторые же предпочитают платить за защищенную электронную почту, анонимный мессенджер и прочие привычные цифровые услуги, но при этом не делиться собственными данными. Каждый волен выбирать сам.

3. К 2025 году в мире будет сгенерировано свыше 180 зеттабайт данных

(Источник: Statista)

В 2022 году объемы всех данных, накопленных человечеством, составили примерно 97 зеттабайт, а к 2025 году это число возрастет до 180 зеттабайт.

Для справки. Один зеттабайт — это миллиард терабайт. Если все объемы существующих сегодня данных запаковать на жесткие диски объемом в терабайт каждый и поставить их один на другой, то общая высота полученной башни будет в два раза больше, чем расстояние от Земли до Луны.

Еще в 90-х годах исследователи определили, что количество информации в мире будет расти экспоненциально — оно будет удваиваться каждые 18 месяцев. И до недавнего времени так и было. Но сейчас информации настолько много, что появились технические препятствия для ее хранения и обработки.

Сейчас в мире существует свыше 7000 крупных дата-центров, из которых больше 800 гипермасштабируемых — со специальной архитектурой, которая позволяет обрабатывать экзабайты (миллионы терабайт) информации, а при необходимости объемы данных в них можно значительно увеличить без существенных изменений в работе центра.

Пять впечатляющих цифр о больших данных за 2022 год

Среднегодовой рост количества данных составляет порядка 18%. Это все еще много, но для удвоения информации потребуется уже три года вместо полутора. Для сравнения — темпы роста объемов информации в 2012 году были 62% годовых.

Не так давно мы сделали классный материал про обработку данных и разные подходы к их обогащению. Как вы думаете, какой из них будет наиболее эффективным и почему?

4. 80% компаний не используют все данные, которые собирают

(Источник: Bloomberg)

По данным исследования агентства LaunchSquad, 96% компаний крупного и среднего бизнеса анализируют собранные данные для повышения прибыли. Из них больше половины (56%) топ-менеджеров нашли с помощью аналитики данных один или несколько новых путей получения дохода. И 4 из 10 директоров отметили, что результаты значительно превысили ожидания от методик анализа.

При этом только 20% брендов используют все данные, которые собирают. На самом деле, причин несколько:

  • 78% менеджеров отметили, что количество информации растет слишком быстро, и специалисты компании просто не успевают обрабатывать ее.
  • 43% представителей бизнеса считают, что у сотрудников недостаточно технических умений.
  • и еще 34% рассказали, что существующая в компании инфраструктура не позволяет получать максимум из собранных данных.

Технические возможности для обработки данных увеличиваются медленнее, чем объемы информации. И по мнению некоторых экспертов, подобная ситуация будет сохраняться до тех пор, пока аналитики не придумают принципиально новые методики аналитики больших массивов необработанных данных.

Как вы считаете, какие российские компании эффективно используют данные и почему?

5. Свыше 90% генерируемых сегодня данных — неструктурированные

(Источник: Research and Markets)

Раз у большинства компаний нет возможности структурировать и анализировать всю информацию, которую они собирают, то количество неструктурированных данных с каждым годом растет.

Неструктурированные данные — это данные, которые не соответствуют заранее определённой модели данных, а также отличаются по типу и и содержанию. Это как если все книги, которые у вас есть, не ставить в книжный шкаф, а вместо этого разобрать их на отдельные страницы и свалить все в кучу, добавив случайных картинок и детских рисунков.

В 2019 доля неструктурированных данных была на уровне 80-90%. Оно рассчитывается по косвенным данным, поэтому точность здесь примерная. Но в 2022 году исследователи считают, что количество необработанных данных увеличилось и сейчас составляет уже выше 90%.

Некоторые эксперты и вовсе утверждают, что структурированных данных в мире всего от 1% до 7%. Остальные же просто хранятся в озерах данных, репозиториях или на серверах компаний.

Даже несмотря на то, что сфера анализа Big data растет на невероятные 30,7% в год, этого все равно недостаточно, чтобы обрабатывать все данные.

А как вы думаете, что могло бы изменить ситуацию? Пишите в комментарии.

О Big Data сегодня говорят много. Тема не вылезет из трендов IT-отрасли, ее активно публикуют околобизнесовые СМИ. Вот только по факту полезной информации не так много. Мы же постарались собрать максимально свежие и актуальные данные от проверенных агентств.

Вам понравилась статья? Пишите, что бы вы хотели узнать о Big Data еще.

* 21 марта 2022 года российский суд признал компанию Meta экстремистской организацией и запретил ее деятельность на территории страны

1818
7 комментариев

Моя бабуля процентов 80% всех сообщений своими открытками делает )
У нас почти вся переписка из них состоит 😅

2
Ответить

Мы на работе делаем кучу отчетов, которые начальство даже не читает. Поэтому когда данные кто-то обрабатывает — не факт, что это помогает.

Ответить

Если Яндекс занимает 1% от рынка поисковиков, то это доля РФ или всего СНГ?

Ответить

Я считаю, поисковики должны на первую строку давать рандомный результат. А чтобы он был качественным, выбирать его из топ-100 или там топ-200

Ответить

Я реально не помню, когда уходила дальше первой страницы в поиске. Алгоритмы не просто так работают, видимо)

Ответить

я конечно подозревал, что мало людей заходят на вторую страницу в гугле, но чтоб на столько мало

Ответить

Я тот самый который уходит и по 5 страницу бывает

Ответить