{"id":6456,"title":"\u041f\u043e\u0447\u0435\u043c\u0443 \u0434\u043b\u044f \u0441\u043e\u0445\u0440\u0430\u043d\u043d\u043e\u0441\u0442\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u043d\u0435\u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0438\u0445 \u0448\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c","url":"\/redirect?component=advertising&id=6456&url=https:\/\/vc.ru\/promo\/281058-pochemu-vazhno-zashchishchat-dannye-vo-vremya-obrabotki&placeBit=1&hash=dc7f2bae2bc390fd70ec9b439b852fb5901b27f8537bbae69b6bbdceddf340ad","isPaidAndBannersEnabled":false}
Будущее
Polyakov Finance

К 2025 году data scientist возьмет управление над 175 миллиардами терабайт данных

90 % мировых данных было создано за последние два года – так свидетельствовала в 2013 году IBM, одна из крупнейших технологических компаний мира. Но уже к 2025 году каждый день будет создаваться 175 миллиардов терабайт данных. Как мир будет управлять этой информацией, и что полезного извлечет каждый для себя?

кадр из фильма "Предел риска"

Сочетая в себе науку и бизнес-аналитику, давая возможность людям оказывать большее влияние на их отрасли, чем генеральные директора и основатели, профессия data scientist, вскоре станет работой мирового значения. Кто займет эту привлекательную позицию? Каков портрет идеального кандидата? По мнению современных хедхантеров, идеальный data scientist – наполовину хакер, наполовину аналитик, эффективно использующий данные для поиска идей и создания продуктов.

В период между 2011 и 2012 годами списки вакансий на позицию data scientist выросли на 15 000%, и это не опечатка. Наука о данных существует около 300 лет, до прихода в нашу жизнь прогресса она была основана на древних философских принципах.

Основная идея науки о данных заключается в том, что информация объективна, и чем больше у вас информации, тем более объективными могут быть выводы, которые вы можете сделать.

Задача исследователей данных - собирать информацию таким образом, чтобы ее можно было проанализировать с помощью алгоритма машинного обучения. Это означает, что поля данных должны быть стандартизированы таким образом, чтобы все данные поступали одинаковым образом, в противном случае данные будут повреждены и их будет слишком сложно использовать должным образом.

«Я верю в будущее искусственного интеллекта. Однако, встает очень важный вопрос – кто меняет ИИ. Здесь важна не только интеллектуальная сторона специалистов, но и этическая, ведь их заключения и предложения несут в будущем огромное влияние не только на бизнес, но и на жизни людей, окружающую среду. Специалисты по данным должны понимать это», - рассуждает Пьер Поликарпов, финансовый директор Поляков Финанс и эксперт в области «Индустрия 4.0».

Ученые, занимающиеся данными, должны разработать основу не только для того, как собирать данные, но и для того, как они хранятся, чтобы обеспечить их применимость. Затем они должны выяснить, какую информацию могут дать данные, и задать правильные вопросы алгоритма машинного обучения. Это требует определенного уровня творческого мышления, поскольку данные ничего вам не скажут, если вы не зададите конкретный вопрос. После того, как желаемые данные собраны, data scientist должен сделать рекомендации для действий, основанных на этих данных. И здесь начинается самое интересное, поскольку рекомендации могут быть самые различные.

Одной из приятных историй в этом отношении является исследование крупнейшей мировой компании в области экспресс-доставки, специализированных перевозок и услуг логистики UPS. Компания максимально исключила левые повороты, чтобы сделать свои услуги поставки более эффективными. Исследование UPS было основано на многолетнем изучении привычек водителя, моделей трафика и многого другого.

Однако миру известны и другие примеры, такие, как крах американского инвестиционного банка Lehman Brothers, впоследствии приведший к всемирному экономическому кризису. Тогда в 2008 году банк выдал кредитов на $680 млрд, при этом обладая капиталом всего в $22,5 млрд. Аналитика показывала, что при такой уязвимой структуре снижение стоимости рынка жилья на уровне 3-5% разом лишало бы банк всего капитала. С началом ипотечного кризиса именно так и произошло, поскольку рекомендации дата-сайентистов если и были, то окончательные решения по ним оказались губительными для всей мировой экономики.

Наука о данных

По мнению аналитиков Поляков Финанс, к 2020 году для специалистов по данным будет открыто более 2,7 млн. рабочих мест. Эти вакансии будут включать инженеров данных, разработчиков программного обеспечения и криптовалюты, специалистов по аппаратному обеспечению ИИ. Исследователи данных должны быть знакомы с языками программирования и аппаратными и программными системами, такими как Python, PyTorch, Hadoop, Spark, язык программирования R и т. д. Люди, работающие на этих работах, получат возможность создавать программное обеспечение для искусственного интеллекта, создавать новые технологии и оптимизировать целые сектора бизнеса так, как никогда раньше.

Будущее науки о данных будет иметь огромное влияние не только на секторы, получающие выгоду, но также, вероятно, на весь мир, поскольку отходы являются колоссальными во многих направлениях экономики. Таким образом, анализ big data приведет не только к снижению затрат и повышению эффективности, но и потенциально к снижению загрязнения окружающей среды.

#ПоляковФинанс #ПьерПоликарпов #polyakovfinance #poliakovfinance #polfinance #bigdata #big_data #datascience #datascientist

{ "author_name": "Polyakov Finance", "author_type": "self", "tags": ["\u043f\u044c\u0435\u0440\u043f\u043e\u043b\u0438\u043a\u0430\u0440\u043f\u043e\u0432","\u043f\u043e\u043b\u044f\u043a\u043e\u0432\u0444\u0438\u043d\u0430\u043d\u0441","polyakovfinance","poliakovfinance","polfinance","datascientist","datascience","big_data","bigdata"], "comments": 15, "likes": 24, "favorites": 110, "is_advertisement": false, "subsite_label": "future", "id": 101794, "is_wide": true, "is_ugc": true, "date": "Fri, 17 Jan 2020 20:19:24 +0300", "is_special": false }
0
15 комментариев
Популярные
По порядку
Написать комментарий...
18

Через сто лет жрецы будут говорить - дата показала будет дождь, смотря в загадочный святящийся прямоугольник. 

Ответить
2

90% из data - garbage

Ответить
4

эх, на золотых рудниках сегодня за такой низкий процент пустой породы - продали бы не только свою душу, но и тысячи других

"Добыча титана и меди считается экономически оправданной, когда в руде их содержится 0.4%. Никеля — если его там 0.4%.

Для редкоземельных элементов цифра — от 2% до… намного меньше. А далее счет идет уже на доли процента содержания металла в руде — от 0.15% и менее…

Для определения рентабельности золотых месторождений считают вообще в граммах на тонну. Сейчас, при нынешней цене золота, разработка рентабельна, когда в руде содержится 4.6 грамма на тонну (с) shkolazhizni.ru/world/articles/66535/ "

Ответить
1

Так то золото. 

Ответить
1

То пизже - это пластилин, из которого можно слепить ооочень многое. Главное - додуматься, что же слепить.

Ответить
2

У меня появляются последователи 90% секты

Ответить
0

Но уже к 2025 году каждый день будет создаваться 175 миллиардов терабайт данных.

Как там кстати дела с записью данных на ДНК-носители? Развивают технологию или забросили?

Ответить
15

Это неинтересно, немодно и даже, прости господи, неполиткорректно - вдруг выяснится, что некоторые расы ровнее  
 

Ответить
5

Дата-саентист (ученый в области данных) это лишь одно из направлений по работе с данными. Возможно таких направлений станет очень много, как в аналитике и тестировании, поэтому станут востребованы специалисты более узкого профиля. Например, дата-фильтровщики, дата-сортировщики, дата-менеджеры, архитекторы данных и т.д.

Большой объем предполагает огромные риски неправильно обработать данные на том или ином этапе, поэтому каждый будет отвечать за свою маленькую часть и знать её на самом высоком уровне.

Ответить
3

Комментарий удален по просьбе пользователя

Ответить
2

Ротация логов спасет мир!

Ответить
1

175 миллиардов терабайт в день это 2E23 байт. Откуда взята такая безумная цифра?

Ответить
6

Откуда взята такая безумная цифра?

Ответить
0

Датагедоооооон!!! Чёрные рынки данных! А-ха-ха-хааааа!!!!Вам ещё про это Гэвин Белсон пророчил

Ответить
Читать все 15 комментариев
Что может быть важнее прибыли. ESG-словарь для инвестора

В 2020–2021 гг. резко возросла популярность темы ответственного инвестирования, или ESG. Идея о том, что инвестиции должны не только приносить прибыль, но и поддерживать экологию и социальную справедливость, привела к тому, что ESG-фонды стали играть значимую роль на мировых рынках капитала.

Конференция GoGlobal! соберет ведущих маркетологов

29 сентября 2021 года впервые состоится GoGlobal! — однодневная онлайн-конференция для маркетологов, заинтересованных в ускорении глобального присутствия своих кампаний.

Как работать удалённо по московскому времени, если живёшь в Сибири

Команда ИТ-компании Southbridge — о преодолении трудностей часовых поясов: графике работы, планировании и отдыхе.

За чей счёт цветёт Крокус?

Вступление.

Меня сняли с рейса S7

Вот так я попал с S7. Возможно, это справедливо и для других авиакомпаний, но проверять не хочу)))

Новый алгоритм Google - палач или миротворец?
«Что-то пошло не так» — причины неудачи проектов внутренней автоматизации

В чем особенность проектов внутренней автоматизации

Создание шрифта для набора логотипов Mail.ru Group
Дайджест новостей Сбера: AR-экскурсия, распознавание животных и премия для учёных

Прогулки по Политехническому музею с роботом Сепулькой, чудеса компьютерного зрения, научная премия — начало сентября в Сбере выдалось насыщенным. Делимся с вами самыми интересными новостями компании во втором выпуске нашего дайджеста.

Порядок цен на мобильные приложения?

Давно не интересовался вопросом. Сколько сейчас стоит разработать мобильное приложение отдельно под iOS и Android?

«Ну, мальчики, вот и я»: мошенник Виктор Люстиг, который продал Эйфелеву башню на металлолом и обманул Аль Капоне Статьи редакции

Виктор Люстиг с 19 лет обманывал людей в США и странах Европы, сменил десятки паспортов и 47 псевдонимов, несколько раз сбежал от полиции. А в тюрьму попал из-за женщины.

Виктор Люстиг
null