Вот простой статистический вопрос, который мне дали. Я не совсем уверен, что понимаю это.
X = количество набранных баллов на экзамене (множественный выбор и правильный ответ - одно очко). Распространен ли бином X?
Ответ профессора был:
Да, потому что есть только правильные или неправильные ответы.
Мой ответ:
Нет, потому что каждый вопрос имеет свою «вероятность успеха» с. Как я понял, биномиальное распределение - это просто серия экспериментов Бернулли, каждый из которых имеет простой результат (успех или неудача) с заданной вероятностью успеха p (и все они «идентичны» в отношении p). Например, подбрасывая (справедливую) монету 100 раз, это 100 экспериментов Бернулли, и все они имеют p = 0,5. Но здесь вопросы имеют разные виды, верно?
self-study
binomial
Павел
источник
источник
Ответы:
Я бы согласился с вашим ответом. Обычно такие данные в настоящее время моделируются с помощью некоторой модели теории ответа на предмет . Например, если вы использовали модель Раша , то бинарный ответ будет смоделирован какИксп я
где можно рассматривать как способность человека, а как вопроса. Таким образом, модель позволяет уловить тот факт, что разные люди различаются по способностям, а вопросы различаются по сложности, и это самая простая из моделей IRT. n δ i iβn n δi i
Ваш профессора ответ предполагает , что все вопросы имеют одинаковую вероятность «успеха» и являются независимыми, так как бином представляет собой распределение суммы IID Бернулли. Он игнорирует два вида зависимостей, описанных выше.n
Как отмечалось в комментариях, если вы посмотрели на распределение ответов конкретного человека (так что вам не нужно беспокоиться об изменчивости между людьми) или ответов разных людей на один и тот же элемент (так что между изменчивости), то распределение будет пуассоново-биномиальным, т. е. распределение суммы неидеальных испытаний Бернулли. Распределение может быть аппроксимировано биномиальным или пуассоновским, но это все. В противном случае вы делаете предположение iid.n
Даже при «нулевом» допущении об угадывании это предполагает отсутствие шаблонов угадывания, поэтому люди не различаются в том, как они угадывают, а предметы не отличаются в том, как они угадываются, поэтому угадывание является чисто случайным.
источник
Ответ на эту проблему зависит от формулировки вопроса и когда информация будет получена. В целом, я склонен согласиться с профессором, но думаю, что объяснение его / ее ответа плохое, и вопрос профессора должен включать больше информации заранее.
Если вы рассматриваете бесконечное количество потенциальных экзаменационных вопросов и набираете один случайный для вопроса 1, то выбираете один случайный для вопроса 2 и т. Д. Затем перейдем к экзамену:
В этих рамках допущены условия биномиального эксперимента.
Увы, плохо предложенные статистические проблемы очень распространены на практике, а не только на экзаменах. Я не колеблясь, буду защищать ваше обоснование перед вашим профессором.
источник
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.
- Я думаю, вы должны четко указать, что экзаменационные вопросы составляются независимо от совокупности потенциальных вопросов. Для них было бы более реалистично соотносить их: если вопрос 1 является легким, вероятно, вам дают легкий экзамен, а вопрос 2 будет легким.Если есть n вопросов, и я могу правильно ответить на любой вопрос с вероятностью p, и у меня будет достаточно времени, чтобы попытаться ответить на все вопросы, и я выполнил 100 из этих тестов, то мои оценки были бы нормально распределены со средним значением np.
Но это не я повторяю тест 100 раз, это 100 разных кандидатов, которые проводят один тест, каждый со своей вероятностью p. Распределение этих р будет основным фактором. Возможно, у вас есть тест, где p = 0,9, если вы хорошо изучили предмет, p = 0,1, если вы этого не сделали, с очень небольшим количеством людей от 0,1 до 0,9. Распределение точек будет иметь очень сильные максимумы при 0,1n и 0,9 n и не будет близко к нормальному распределению.
С другой стороны, существуют тесты, в которых каждый может ответить на любой вопрос, но занимает разное время, поэтому некоторые ответят на все n вопросов, а другие ответят меньше, потому что у них заканчивается время. Если мы можем предположить, что скорость кандидатов нормально распределена, то точки будут близки к нормальному распределению.
Но многие тесты будут содержать некоторые очень сложные и некоторые очень простые вопросы, намеренно, чтобы мы могли различать лучших кандидатов (которые ответят на все вопросы с некоторой степенью сложности) и худших кандидатов (которые смогут ответить только очень простые вопросы). Это очень сильно изменит распределение точек.
источник
По определению, биномиальное распределение - это набор из независимых и одинаково распределенных испытаний Бернулли. В случае экзамена с несколькими вариантами ответов каждый из вопросов будет одним из испытаний Бернулли.нn n
Проблема здесь возникает, потому что мы не можем разумно предположить, что вопросов:n
Я видел вопросы в классах статистики, которые моделируют экзаменационные вопросы в виде биномов, но они выглядят так:
В этом сценарии, конечно, он будет представлен в виде биномиального распределения с .p=14
источник