Представьте, что вы должны составлять отчеты о количестве кандидатов, которые ежегодно сдают данный тест. Кажется довольно сложным сделать вывод о наблюдаемом проценте успеха, например, для более широкой популяции из-за специфики целевой популяции. Таким образом, вы можете считать, что эти данные представляют все население.
Действительно ли результаты тестов показывают, что пропорции мужчин и женщин действительно правильны? Является ли тест, сравнивающий наблюдаемые и теоретические пропорции, правильным, поскольку вы рассматриваете целую популяцию (а не образец)?
На самом деле, если вы действительно уверены, что у вас есть все население, вам даже не нужно вдаваться в статистику. Тогда вы точно знаете, насколько велика разница, и нет никаких оснований для того, чтобы больше ее проверять. Классическая ошибка - использование статистической значимости в качестве «соответствующей» значимости. Если вы выбрали население, разница в том, что это такое.
С другой стороны, если вы переформулируете свою гипотезу, то кандидатов можно рассматривать как выборку возможных кандидатов, которая позволит провести статистическое тестирование. В этом случае вы будете тестировать в целом, отличаются ли мужчины и женщины от теста под рукой.
Как уже говорилось, вы можете использовать тесты нескольких лет и добавить время как случайный фактор. Но если вы действительно заинтересованы в различиях между этими кандидатами в этом конкретном тесте, вы не можете использовать обобщение, и тестирование бессмысленно.
источник
Традиционно статистический вывод преподается в контексте вероятностных выборок и характера ошибки выборки. Эта модель является основой для проверки значимости. Однако есть и другие способы моделирования систематических отклонений от случайности, и оказывается, что наши параметрические (основанные на выборке) тесты, как правило, являются хорошим приближением к этим альтернативам.
Параметрические проверки гипотез полагаются на теорию выборки для получения оценок вероятной ошибки. Если выборка данного размера берется из популяции, знание систематического характера выборки делает тестирование и доверительные интервалы значимыми. Для популяции теория выборки просто не актуальна, а тесты не имеют смысла в традиционном смысле. Вывод бесполезен, нечего выводить, есть только вещь ... сам параметр.
Некоторые обходят это, обращаясь к суперпопуляциям, которые представляет текущая перепись. Я считаю эти обращения неубедительными - параметрические тесты основаны на вероятностной выборке и ее характеристиках. Популяция в данный момент времени может быть выборкой большей популяции во времени и месте. Тем не менее, я не вижу способа, чтобы можно было обоснованно утверждать, что это случайная (или, в более общем случае, любая форма вероятностной) выборки. Без вероятностной выборки теория выборки и традиционная логика тестирования просто не применимы. С таким же успехом вы можете протестировать на основе удобного образца.
Ясно, что для того, чтобы принять тестирование при использовании совокупности, нам нужно отказаться от основы этих тестов в процедурах отбора проб. Один из способов сделать это - распознать тесную связь между нашими теоретико-выборочными тестами, такими как t, Z и F, и процедурами рандомизации. Рандомизационные тесты основаны на имеющейся выборке. Если я собираю данные о доходах мужчин и женщин, вероятностная модель и основа для наших оценок ошибок - это повторяющиеся случайные распределения фактических значений данных. Я мог бы сравнить наблюдаемые различия между группами с распределением на основе этой рандомизации. (Кстати, мы делаем это все время в экспериментах, где случайная выборка из популяционной модели редко подходит).
Теперь оказывается, что теоретико-выборочные тесты часто являются хорошими приближениями рандомизированных тестов. Таким образом, в конечном счете, я думаю, что тесты от групп населения полезны и значимы в этой структуре и могут помочь отличить систематическое от случайного отклонения - как и в случае тестов на основе выборок. Используемая для этого логика немного отличается, но она не сильно влияет на практическое значение и использование тестов. Конечно, может быть лучше просто использовать рандомизацию и тесты перестановок напрямую, учитывая, что они легко доступны со всеми нашими современными вычислительными возможностями.
источник
Предположим, что результаты показывают, что кандидаты различаются по признаку пола. Например, доля тех, кто прошел тесты, выглядит следующим образом: 40% женщин и 60% мужчин. Чтобы предположить очевидное, 40% отличается от 60%. Теперь важно решить: 1) интересующее вас население; 2) как ваши наблюдения относятся к интересующему населению. Вот некоторые подробности об этих двух проблемах:
Если интересующая вас группа представляет собой только тех кандидатов, которых вы наблюдали (например, 100 кандидатов, подавших заявление в университет в 2016 году), вам не нужно сообщать о статистических тестах значимости. Это потому, что ваша группа интересов была полностью отобрана ... все, что вас волнует, это 100 кандидатов, по которым у вас есть полные данные. То есть 60% - это полная остановка, отличная от 40%. На вопрос, на который он отвечает, были ли гендерные различия в популяции из 100 человек, которые применяли программу? Это описательный вопрос, и ответ - да.
Однако многие важные вопросы касаются того, что произойдет в разных условиях. То есть многие исследователи хотят придумать тенденции прошлого, которые помогают нам предсказывать (а затем планировать) будущее. В качестве примера можно привести вопрос: насколько вероятно, что будущие тесты кандидатов будут отличаться по признаку пола? Население, представляющее интерес, тогда шире, чем в сценарии № 1 выше. На данный момент, важный вопрос, который нужно задать: является ли ваши наблюдаемые данные репрезентативными для будущих тенденций? Это логичный вопрос, и на основании информации, предоставленной оригинальным постером, ответ таков: мы не знаем.
В целом, какие статистические данные вы сообщаете, зависит от типа вопроса, на который вы хотите ответить.
Размышление о базовом дизайне исследования может быть наиболее полезным (попробуйте здесь: http://www.socialresearchmethods.net/kb/design.php ). Размышление о суперпопуляциях может помочь, если вам нужна более подробная информация (вот статья, которая может помочь: http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 ).
источник
Если вы считаете все, что вы измеряете, случайным процессом, тогда да, статистические тесты актуальны. Взять, к примеру, подбрасывание монеты 10 раз, чтобы увидеть, честно ли это. Вы получаете 6 голов и 4 хвоста - что вы делаете?
источник