Хитрый вопрос на собеседовании про доверительный интервал

Посмотрите на картинку. Как вы думаете, доверительнй интервал это закрашенная площадь (1) или линия на оси X (2)?

Хитрый вопрос на собеседовании про доверительный интервал

Недавно разгорелся нешуточный спор про то как правильно видеть доврительный интервал. И утверждалось, что если вы, как и я, ответили линия на оси Х (2), то это грубейшая ошибка, которая бы руинила все собеседование.

если бы дело происходило на собеседовании, оно было бы к этому моменту закончено

Давайте разберемся, насколько эти выводы обоснованы.

Зачем нужен доверительный интервал?

Пусть мы провели опрос с целью оценить долю избирателей некоторого кандидата в президенты. Опросили 1000 человек, и 275 его поддерживают, значит выборочная доля сторонников кандидата равна 27.5%. Это точечная оценка для доли его сторонников во всей стране. Но может так оказаться, что она малоинформативна.

Намного лучше знать не просто точечную оценку 27.5%, а интервал, в котором с большой вероятностью находится доля сторонников кандидата. Скажем, с 95% вероятностью доля сторонников лежит в пределах от 25% до 30%.

Доверительный интервал – это интервал, который с заданной вероятностью накрывает оцениваемый параметр генеральной совокупности.

Прямо из определения следует, что доверительный интервал - это интервал (не площадь), а интервал можно представить как отрезок ("линию") на оси оХ.

Хитрый вопрос на собеседовании про доверительный интервал

Причем тогда здесь площадь?

Нормальное распределение обладает интересным свойством: Гауссова кривая для определения критического значения Z, соответствующего доверительному уровню, равному: (а) 95%; (б) 99%.

Хитрый вопрос на собеседовании про доверительный интервал

Это означает, что если вы знаете значения 95% доверительного интервала [a;b], то можете быть уверенным, что 95% площади фигуры лежит в пределах этого интервала.

И наоборот, если отрежете по 2.5% площади с 2-х краев (всего -5%), то отрезок [a;b], на котором лежит оставшаяся 95% часть площади, является 95% доверительным интервалом.

Какой ответ в итоге верный?

Нет ошибки в том, чтобы видеть доверительный инетрвал в нормальном распределении как отрезок ("линию") или как площадь. И тот, и другой варианты верны, потому что в 1-м случае это следует из определения, а во 2-м интервал можно посчитать через площадь.

P.S.

Я не являюсь экспертом в статистике и тем более экспертом в таких тонкостях (да, для меня это тонкости). Просто пытаюсь проверять свои выводы на адеквтность. Поэтому, если вы видите ошибки, то буду рада услышать конструктивную критику по возможности избегая общих рекомендаций "погуглить" или "почитать книжки" и апелляцию к авториту. Такие рекомендации я уже слушал, они мне не помогли.

1 комментарий

1. Есть такое понятие - "словоблудие". За словами теряется смысл, а то что по своей природе просто - человек выставляет сложным. Когда человек начинает этим заниматься, то люди это сразу замечают.
С математикой же, почему-то, людт это не замечают. Математика - наиболее понятная, простая и до ужаса логичная наука, которая объясняет окружающий мир с помощью цифр. Это инструмент. Им "гвозди" забивают. Но российское математическое образование (за другие говорить не могу, так как не знаю) занимается "числовым онанизмом", доставшееся от советских времен. Все вот эти "найти равентва между двумя уравнениям с x^4" и т.д. не имеют практического применения (если конечно вы не занимаетесь теоретической визикой пытаясь с помощью уравнений описать вселенную). Это все знания без практики, дом без фундамента. Отсюда и люди, которые на собеседованиях задают такие вопросы. Спорить с ними, а тем более работать - не надо. Себе дороже.
2. Математика разная. С разными направлениями. Например, есть определенные (1,2,3,4), неопределенные (x,y,z) и недоопределенные (интервальные от 1 до 3) значения. Можно быть профессионалом в одном направлении, и не знать, что происходит в других. Опять же, это как с инструментами - уметь хорошо забивать гвозди и плохо красить стены - это нормально. Значит ты плотник, а не моляр. Это тоже нужно понимать

1
Ответить