{"id":4879,"title":"\u0427\u0442\u043e \u043c\u043e\u0436\u043d\u043e \u0443\u0441\u043f\u0435\u0442\u044c, \u043f\u043e\u043a\u0430 \u0432\u044b \u0447\u0438\u0442\u0430\u0435\u0442\u0435 \u044d\u0442\u0443 \u0441\u0442\u0430\u0442\u044c\u044e","url":"\/redirect?component=advertising&id=4879&url=https:\/\/vc.ru\/otpbank\/266952&hash=82572a4a372a00657a2afc359f19a24c0bd24be8cecbd743f0681209c07c9a3a","isPaidAndBannersEnabled":false}
Будущее
Polyakov Finance

К 2025 году data scientist возьмет управление над 175 миллиардами терабайт данных

90 % мировых данных было создано за последние два года – так свидетельствовала в 2013 году IBM, одна из крупнейших технологических компаний мира. Но уже к 2025 году каждый день будет создаваться 175 миллиардов терабайт данных. Как мир будет управлять этой информацией, и что полезного извлечет каждый для себя?

кадр из фильма "Предел риска"

Сочетая в себе науку и бизнес-аналитику, давая возможность людям оказывать большее влияние на их отрасли, чем генеральные директора и основатели, профессия data scientist, вскоре станет работой мирового значения. Кто займет эту привлекательную позицию? Каков портрет идеального кандидата? По мнению современных хедхантеров, идеальный data scientist – наполовину хакер, наполовину аналитик, эффективно использующий данные для поиска идей и создания продуктов.

В период между 2011 и 2012 годами списки вакансий на позицию data scientist выросли на 15 000%, и это не опечатка. Наука о данных существует около 300 лет, до прихода в нашу жизнь прогресса она была основана на древних философских принципах.

Основная идея науки о данных заключается в том, что информация объективна, и чем больше у вас информации, тем более объективными могут быть выводы, которые вы можете сделать.

Задача исследователей данных - собирать информацию таким образом, чтобы ее можно было проанализировать с помощью алгоритма машинного обучения. Это означает, что поля данных должны быть стандартизированы таким образом, чтобы все данные поступали одинаковым образом, в противном случае данные будут повреждены и их будет слишком сложно использовать должным образом.

«Я верю в будущее искусственного интеллекта. Однако, встает очень важный вопрос – кто меняет ИИ. Здесь важна не только интеллектуальная сторона специалистов, но и этическая, ведь их заключения и предложения несут в будущем огромное влияние не только на бизнес, но и на жизни людей, окружающую среду. Специалисты по данным должны понимать это», - рассуждает Пьер Поликарпов, финансовый директор Поляков Финанс и эксперт в области «Индустрия 4.0».

Ученые, занимающиеся данными, должны разработать основу не только для того, как собирать данные, но и для того, как они хранятся, чтобы обеспечить их применимость. Затем они должны выяснить, какую информацию могут дать данные, и задать правильные вопросы алгоритма машинного обучения. Это требует определенного уровня творческого мышления, поскольку данные ничего вам не скажут, если вы не зададите конкретный вопрос. После того, как желаемые данные собраны, data scientist должен сделать рекомендации для действий, основанных на этих данных. И здесь начинается самое интересное, поскольку рекомендации могут быть самые различные.

Одной из приятных историй в этом отношении является исследование крупнейшей мировой компании в области экспресс-доставки, специализированных перевозок и услуг логистики UPS. Компания максимально исключила левые повороты, чтобы сделать свои услуги поставки более эффективными. Исследование UPS было основано на многолетнем изучении привычек водителя, моделей трафика и многого другого.

Однако миру известны и другие примеры, такие, как крах американского инвестиционного банка Lehman Brothers, впоследствии приведший к всемирному экономическому кризису. Тогда в 2008 году банк выдал кредитов на $680 млрд, при этом обладая капиталом всего в $22,5 млрд. Аналитика показывала, что при такой уязвимой структуре снижение стоимости рынка жилья на уровне 3-5% разом лишало бы банк всего капитала. С началом ипотечного кризиса именно так и произошло, поскольку рекомендации дата-сайентистов если и были, то окончательные решения по ним оказались губительными для всей мировой экономики.

Наука о данных

По мнению аналитиков Поляков Финанс, к 2020 году для специалистов по данным будет открыто более 2,7 млн. рабочих мест. Эти вакансии будут включать инженеров данных, разработчиков программного обеспечения и криптовалюты, специалистов по аппаратному обеспечению ИИ. Исследователи данных должны быть знакомы с языками программирования и аппаратными и программными системами, такими как Python, PyTorch, Hadoop, Spark, язык программирования R и т. д. Люди, работающие на этих работах, получат возможность создавать программное обеспечение для искусственного интеллекта, создавать новые технологии и оптимизировать целые сектора бизнеса так, как никогда раньше.

Будущее науки о данных будет иметь огромное влияние не только на секторы, получающие выгоду, но также, вероятно, на весь мир, поскольку отходы являются колоссальными во многих направлениях экономики. Таким образом, анализ big data приведет не только к снижению затрат и повышению эффективности, но и потенциально к снижению загрязнения окружающей среды.

#ПоляковФинанс #ПьерПоликарпов #polyakovfinance #poliakovfinance #polfinance #bigdata #big_data #datascience #datascientist

{ "author_name": "Polyakov Finance", "author_type": "self", "tags": ["\u043f\u044c\u0435\u0440\u043f\u043e\u043b\u0438\u043a\u0430\u0440\u043f\u043e\u0432","\u043f\u043e\u043b\u044f\u043a\u043e\u0432\u0444\u0438\u043d\u0430\u043d\u0441","polyakovfinance","poliakovfinance","polfinance","datascientist","datascience","big_data","bigdata"], "comments": 15, "likes": 24, "favorites": 110, "is_advertisement": false, "subsite_label": "future", "id": 101794, "is_wide": true, "is_ugc": true, "date": "Fri, 17 Jan 2020 20:19:24 +0300", "is_special": false }
0
15 комментариев
Популярные
По порядку
Написать комментарий...
18

Через сто лет жрецы будут говорить - дата показала будет дождь, смотря в загадочный святящийся прямоугольник. 

Ответить
2

90% из data - garbage

Ответить
4

эх, на золотых рудниках сегодня за такой низкий процент пустой породы - продали бы не только свою душу, но и тысячи других

"Добыча титана и меди считается экономически оправданной, когда в руде их содержится 0.4%. Никеля — если его там 0.4%.

Для редкоземельных элементов цифра — от 2% до… намного меньше. А далее счет идет уже на доли процента содержания металла в руде — от 0.15% и менее…

Для определения рентабельности золотых месторождений считают вообще в граммах на тонну. Сейчас, при нынешней цене золота, разработка рентабельна, когда в руде содержится 4.6 грамма на тонну (с) shkolazhizni.ru/world/articles/66535/ "

Ответить
1

Так то золото. 

Ответить
1

То пизже - это пластилин, из которого можно слепить ооочень многое. Главное - додуматься, что же слепить.

Ответить
2

У меня появляются последователи 90% секты

Ответить
0

Но уже к 2025 году каждый день будет создаваться 175 миллиардов терабайт данных.

Как там кстати дела с записью данных на ДНК-носители? Развивают технологию или забросили?

Ответить
15

Это неинтересно, немодно и даже, прости господи, неполиткорректно - вдруг выяснится, что некоторые расы ровнее  
 

Ответить
5

Дата-саентист (ученый в области данных) это лишь одно из направлений по работе с данными. Возможно таких направлений станет очень много, как в аналитике и тестировании, поэтому станут востребованы специалисты более узкого профиля. Например, дата-фильтровщики, дата-сортировщики, дата-менеджеры, архитекторы данных и т.д.

Большой объем предполагает огромные риски неправильно обработать данные на том или ином этапе, поэтому каждый будет отвечать за свою маленькую часть и знать её на самом высоком уровне.

Ответить
3

Комментарий удален по просьбе пользователя

Ответить
2

Ротация логов спасет мир!

Ответить
1

175 миллиардов терабайт в день это 2E23 байт. Откуда взята такая безумная цифра?

Ответить
6

Откуда взята такая безумная цифра?

Ответить
0

Датагедоооооон!!! Чёрные рынки данных! А-ха-ха-хааааа!!!!Вам ещё про это Гэвин Белсон пророчил

Ответить
Читать все 15 комментариев
Amazon отчиталась за второй квартал: выручка выросла на 27%, до $113,08 млрд, прибыль — на 48,4%, до $7,7 млрд Статьи редакции

Прибыль выросла за счёт роста выручки от облачных сервисов, рекламы и подписок.

Бизнес с «нуля». Как эффективно продвигать стартап?

«Начинать новую жизнь нужно с теми, кто тебе действительно дорог” (Лукас Скотт “Холм одного дерева»).

17 причин не использовать чаты в работе, перевод статьи основателя Basecamp

Краткая справка про ребят из Basecamp — с 2006 года делают софт для ведения проектов и удаленных команд, первые на рынке рабочих чатов. Раньше вели блог Signal vs. Noise, где много интересных статей. Джейсон Фрид, основатель, написал две книги — Remote и Rework.

Huawei выпустила новые смартфоны без 5G на фоне санкций США и дефицита чипов Статьи редакции

Компания заявляет, что из-за ограничений ей недоступны технологии 5G.

Суд запретил работу Samsung Pay в России из-за патентного спора. Решение вступит в силу через 30 дней Статьи редакции

Если его не обжалуют.

Aleph расширяет присутствие на Ближнем Востоке: холдинг приобрел контрольный пакет акций Connect Ads

Aleph Holding, глобальный партнер крупнейших диджитал платформ и материнская компания Httpool, объявил о приобретении контрольного пакета акций Connect Ads. Компания является провайдером цифровых медиа и рекламных решений в странах Ближнего Востока и Африки.

PERI развивает систему управления производством с 1С:ERP
Власти США предъявили обвинения основателю производителя электрогрузовиков Nikola миллиардеру Тревору Милтону Статьи редакции

Присяжные требуют, чтобы Милтон лишился всего имущества и денег, «связанных с преступлением», это может быть около $1 млрд.

Тревор Милтон The Verge
Распространенные ошибки в бизнесе интернет-магазинов
Итоги Python meetup: медленные языки, быстрые роботы
Как оцифровать ремонт колесных пар? Ответ нашли в Первой грузовой компании

Мы завершили разработку интеллектуальной системы, которая на основе контрольно-технических измерений позволяет отслеживать толщину колесных пар (ИС КТИ). С ее помощью компания снижает расходы на ремонт и повышает уровень клиентского сервиса. Проект является частью масштабной разработки под названием «Цифровой вагон». В статье мы подробно…

null