{"id":7725,"title":"\u041c\u043e\u0441\u043c\u0435\u0442\u0440\u043e \u043e\u0442\u0432\u0435\u0442\u0438\u043b\u0438 \u043d\u0430 \u0447\u0430\u0441\u0442\u044b\u0435 \u0432\u043e\u043f\u0440\u043e\u0441\u044b \u043e \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0438 \u043b\u0438\u0446","url":"\/redirect?component=advertising&id=7725&url=https:\/\/vc.ru\/promo\/306052-v-metro-moskvy-teper-mozhno-platit-za-proezd-licom-sprosili-avtorov-proekta-kak-eto-rabotaet&placeBit=1&hash=1a23ae72488790d266f074c318177ed55db913e2e0bf5b3cbc11221f61048c67","isPaidAndBannersEnabled":false}
SF Education

Что такое регрессионный анализ?

Изображение Pete Linforth с сайта Pixabay

Регрессионный анализ — это набор статистических методов оценки отношений между переменными. Его можно использовать для оценки степени взаимосвязи между переменными и для моделирования будущей зависимости. По сути, регрессионные методы показывают, как по изменениям «независимых переменных» можно зафиксировать изменение «зависимой переменной».

Зависимую переменную в бизнесе называют предиктором (характеристика, за изменением которой наблюдают). Это может быть уровень продаж, риски, ценообразование, производительность и так далее. Независимые переменные — те, которые могут объяснять поведение выше приведенных факторов (время года, покупательная способность населения, место продаж и многое другое).Регрессионный анализ включает несколько моделей. Наиболее распространенные из них: линейная, мультилинейная (или множественная линейная) и нелинейная.

SF Education

Как видно из названий, модели отличаются типом зависимости переменных: линейная описывается линейной функцией; мультилинейная также представляет линейную функцию, но в нее входит больше параметров (независимых переменных); нелинейная модель — та, в которой экспериментальные данные характеризуются функцией, являющейся нелинейной (показательной, логарифмической, тригонометрической и так далее).

Чаще всего используются простые линейные и мультилинейные модели.

Регрессионный анализ предлагает множество приложений в различных дисциплинах, включая финансы.

Рассмотрим поподробнее принципы построения и адаптации результатов метода.

Предположения линейной модели

Линейный регрессионный анализ основан на шести фундаментальных предположениях:

  • Переменные показывают линейную зависимость;
  • Независимая переменная не случайна;
  • Значение невязки (ошибки) равно нулю;
  • Значение невязки постоянно для всех наблюдений;
  • Значение невязки не коррелирует по всем наблюдениям;
  • Остаточные значения подчиняются нормальному распределению.

Построение простой линейной регрессии

Простая линейная модель выражается с помощью следующего уравнения:

Y = a + bX

Где:

  • Y — зависимая переменная
  • X — независимая переменная (объясняющая)
  • а – свободный член (сдвиг по оси OY)
  • b – угловой коэффициент. Он указывает на поведение кривой (убывает или возрастает, угол между с осью)

a и b называют коэффициентами линейной регрессии. В их нахождении и заключается основная задача.

Рис.1. Линия линейной регрессии

Y = a + b1 x1 + b2 x2 + b3 x3

Рис.2. Множественная регрессия

Существует много способов определить коэффициенты a и b. Но самым простым и надежным является метод наименьших квадратов (можно научно доказать, что это лучший способ).

Рис. 3. Линия линейной регрессии.Пунктиром изображено расстояние y – Y для каждой точки.

Ключевым фактором применения любой статистической модели является правильное понимание предметной области и ее бизнес-приложения.

Линейная регрессия — это довольно простой, но мощный инструмент, который может существенно облегчить работу аналитика при изучении поведения потребителей; факторов, влияющих на производительность и окупаемость; улучшит понимание бизнес процессов в целом.

Примеры использования линейной регрессии

Прогнозирование показателей

Данную модель можно использовать для обнаружения тенденций и составления прогнозов. Предположим, продажи компании росли на протяжении двух лет. Путем проведения линейного анализа данных о ежемесячных продажах компания могла бы спрогнозировать продажи в будущие месяцы.

Оценка эффективности маркетинга

Линейная регрессия также может использоваться для оценки эффективности маркетинга, рекламных кампаний и ценообразования. Чтобы компания «XYZ» оценила качественную отдачу от средств, потраченных на маркетинг определенного бренда, достаточно построить график линейной регрессии и посмотреть, как связаны затраты с прибылью.

Прелесть линейной регрессии в том, что она позволяет улавливать отдельные воздействия каждой маркетинговой кампании, а также контролировать факторы, которые могут повлиять на продажи.

В реальных сценариях обычно существует несколько рекламных кампаний, которые проводятся в один и тот же период времени. Предположим, что две кампании запускаются на телевидении и радио параллельно. Построенная модель может уловить как изолированное, так и комбинированное влияние одновременного показа этой рекламы.

Оценка риска

Модель линейной регрессии хорошо работает для расчета рисков в сфере финансов или страхования. К примеру, компания по страхованию автомобилей может построить линейную регрессию, чтобы составить таблицу выплат по страховке, используя отношение прогнозируемых исков к заявленной страховой стоимости. Основными факторами в такой ситуации являются характеристики автомобиля, данные о водителе или демографическая информация. Результаты такого анализа помогут в принятии важных деловых решений.

Обнаружение важных факторов

В индустрии кредитования финансовая компания заинтересована в минимизации рисков. Поэтому ей важно понять пять основных факторов, вызывающих неплатежеспособность клиента. На основе результатов регрессионного анализа компания могла бы выявить эти факторы и определить варианты EMI (Equated Monthly Installment – фиксированный платеж, произведенный заемщиком кредитору в течение оговоренного срока), чтобы минимизировать дефолт среди сомнительных клиентов.

Ценообразование активов

Еще модель линейной регрессии находит свое применение в ценообразовании активов. «Модель оценки долгосрочных активов» описывает связь между ожидаемой доходностью и риском инвестирования в ценную бумагу. Это помогает инвесторам оценивать целесообразность инвестиций и доходность их портфеля.

Вывод

Несмотря на то, что линейная регрессия имеет довольно жесткие ограничения, поскольку она может работать только тогда, когда зависимая переменная имеет непрерывный характер и имеется линейная зависимость между переменными, модель является самым известным методом анализа и прогнозирования.

Мы привели самые популярные примеры использования данной модели в бизнесе и финансах. Естественно, чтобы глубоко понять, как его использовать в той или иной ситуации, нужно погрузиться в метод поподробнее – самостоятельно «пощупать» все его слабые и сильные стороны; посмотреть, как модель ведет себя на уникальных данных и так далее. Это очень интересный и важный процесс – именно поэтому индустрия Data Science сейчас находится на таком подъеме!

0
0 комментариев
Популярные
По порядку
Читать все 0 комментариев
Как мы создали свой курс, какие ошибки совершали, к чему пришли. И стоило ли это того

Честная история в пяти главах о том, как создать качественный онлайн-курс с нуля. Спойлер: это совсем непросто.

Газпромбанк и IT_One создали новую финтех-компанию

«ГПБ-ИТ1» станет одним из крупнейших центров по разработке цифровых и финансовых сервисов

Тренд на биометрическую идентификацию: как нейронные сети распознают наши лица
Этический кодекс ИИ и признание авторства на продукт, произведенный алгоритмом

26 октября участники форума «Этика искусственного интеллекта: начало доверия» подписали российский Кодекс этики искусственного интеллекта (ИИ). Документ по предложению президента России Владимира Путина подготовили Министерство экономического развития РФ, Аналитический центр при Правительстве РФ и Альянс в сфере искусственного интеллекта. Кодекс…

Лучшие стартапы в «Трибуне» с 18 по 24 октября 2021 года

Подборка лучших проектов по рейтингу подготовлена каналом @vchunt, где каждую неделю появляется топ-3 стартапа из «Трибуны». Подписывайтесь, чтобы поддержать русскоязычных фаундеров и не пропустить отличные продукты!

TalkBank единственная финтех-компания из России, которая получила ежегодную премию IBSi NeoChallenger Bank Awards

Ежегодная награда IBSi NeoChallenger Banking Awards направлена на выявление и награждение технологических игроков и банков за их выдающиеся достижения в области внедрения банковских технологий и инноваций. Финтех-платформа TalkBank — единственная российская компания, получившая награду.

Капитализация Tesla превысила $1 трлн: что на это повлияло и почему так дорого Статьи редакции

Сказались заказ Hertz на 100 тысяч электромобилей и рост рентабельности бизнеса, а инвесторы смотрят наперёд.

Отчёт VK за квартал: выручка выросла на 19%, до 30,41 млрд рублей, большая часть пришлась на игры и рекламу Статьи редакции

Компания опубликовала результаты за третий квартал на Лондонской бирже.

Что на самом деле приводит мир в движение: история инструментов бухгалтерского учёта

От засечек на палках до специальных программ

UNIVAC I.
ИТ-школа Lambda School берёт плату только после трудоустройства учеников — но они жалуются, что там ничему не учат Статьи редакции

Ради ускоренных курсов по разработке Lambda School студенты бросали работу и колледж, ведь школа заявляла, что 74% выпускников успешно находят высокооплачиваемые места. Business Insider пишет, что трудоустраивается только 30%, а студенты зарабатывают после обучения даже меньше, чем раньше.

Fortune
null