2. Закономерности, которых нет

Иллюзия кластеризации – тенденция видеть закономерности там, где их на самом деле нет. 👀

Нашему мозгу гораздо комфортнее, когда есть четкие закономерности:
🔸Не суй пальцы в розетку – убьёт.
🔸Занимайся физкультурой – будешь чувствовать себя лучше.
🔸Если блеснула молния – значит скоро будет гром.

Закономерностями мы облегчаем нагрузку на мышление, не надо каждый раз выстраивать длинные умозаключения почему будет именно так.

Но такая удобная функция может сыграть и против нас. Например, вы опросили 10 своих друзей (8 парней и 2 девушки), понравился ли им новый фильм, если он понравился всем кроме 2 девушек, то можно прийти к выводу, что:
🔸Фильм не понравится почти всем девушкам.
🔸Фильм не понравится 20% зрителей.

Иллюзия вызвана склонностью недооценивать степень изменчивости, когда у нас мало данных. Статистика может очень сильно измениться, если вы опросите 1000 человек.

В сфере фондовых рынков аналогично примеров тоже много:
🔸В среднем падение акций в кризис длится 1-2 года.
🔸В мае обычно рынки падают, а осенью растут.
🔸Цена акций Apple Inc (AAPL) растет после ежегодной презентации новых устройств.

❓Достаточно ли было финансовых кризисов и презентаций Apple для надежной статистики? За время наблюдений ничего не поменялось, данные однородны?

👉 Есть ряд цифр: «2, 4, 6», каким будет следующее число? Мы быстро находим закономерность – это арифметическая прогрессия. Но эти три числа вполне могут оказаться просто случайными, а мы уже посчитали результат на 3 позиции вперед.

Иллюзорная корреляция – явление, обнаружения тесной связи между рядами значений, в то время, когда в реальности связи нет или она гораздо слабее. Такая корреляция может быть обнаружена где угодно, а причина все та же – в нашем распоряжении недостаточно данных.

👉 В течение 15 месяцев проводилось исследование, где записывались симптомы пациентов с артритом и погодные условия. Почти все пациенты сообщили, что их боли связаны с погодными условиями, хотя реальная корреляция была равна нулю.

❗Люди соединяют события как сопутствующие друг другу – боль и плохую погоду, но мало обращают внимание на комбинации боль – хорошая погода и плохая погода без боли.

Где-то рядом существует ложная зависимость. Это тот случай, когда обнаруживается тесная зависимость вследствие совпадения или из-за наличия общего определяющего фактора. Тут данных уже достаточно.

👉 Известный пример ложной зависимости – это взаимосвязь продаж мороженного и количество утопленников. Выше продажи – больше утонувших и наоборот. Это не значит, что переменные влияют друг на друга. Запрет продаж мороженного не спасет ни одного человека. У этих рядов данных есть сторонний общий фактор – погодные условия (жара).

Посмотрите как отлично коррелируют индекс S&P500 и bitcoin.

2. Закономерности, которых нет

Вывод. Нужно быть осторожным, если используете не надежные закономерности, построенные на малом количестве данных. А также выяснять причины зависимостей.

33
реклама
разместить
2 комментария

Слишком маленькая выборка. Ты знаешь соседей, друзей, коллег, их мнения — больше никого. Но это мало. Сколько их? Десять? Двадцать? Тысяча? Ты очень общителен, но больше Десяти тысяч не наберешь. Да и мало знать имя, возраст, лицо - нужно знать мнение каждого. Мнение скольких ты знаешь? Десяти? Одного? Ты свое-то знаешь? Слишком маленькая выборка. «Все считают...» — чистейшая демагогия и явная ложь. «Большинство за...» — да кто их считает? Статистика — последняя из шлюх.
Говорят: он много повидал. Много мест, людей. А другой нигде не был и знает себя да одну блядь. Но первый знает человека ничуть не лучше второго. Слишком маленькая выборка. Достаточно знать одного, чтобы знать всех. Достаточно знать себя. Дальше узнавать не имеет смысла. Если все люди похожи, ты узнаешь любого по одному. Если все разные, не узнаешь и по тысяче: капля в море.