Вопросы с тегом «sample-size»

Этот тег очень неоднозначен. Используйте его, когда речь идет о размере выборки, и НИЧЕГО из следующего не подходит: [small-sample], [large-data], [power-analysis], [power], [underdetermined] или [unbalanced-classes].

129
Являются ли большие наборы данных неподходящими для проверки гипотез?

В недавней статье в Amstat Новости , авторы (Марк ван дер Лан и Шерри Роуз) заявил , что «Мы знаем , что для достаточно больших размеров выборки, каждое исследование, в том числе те , в которых нулевая гипотеза об отсутствии эффекта верно - будет объявить статистически значимый эффект. Ну, я,...

81
Имеет ли значение несбалансированный образец при выполнении логистической регрессии?

Итак, я думаю, что у меня есть достаточно приличная выборка, принимая во внимание эмпирическое правило 20: 1: довольно большая выборка (N = 374) для в общей сложности 7 потенциальных переменных-предикторов. Моя проблема заключается в следующем: независимо от того, какой набор переменных предикторов...

72
Эмпирические правила для минимального размера выборки для множественной регрессии

В рамках предложения по исследованию социальных наук мне был задан следующий вопрос: Я всегда использовал 100 + m (где m - количество предикторов) при определении минимального размера выборки для множественной регрессии. Это уместно? Я часто получаю похожие вопросы, часто с разными правилами. Я...

71
Существует ли минимальный размер выборки, необходимый для того, чтобы t-тест был действительным?

В настоящее время я работаю над квази-экспериментальной исследовательской работой. У меня размер выборки только 15 из-за низкой численности населения в выбранной области, и только 15 соответствуют моим критериям. Является ли 15 минимальным размером выборки для t-теста и F-теста? Если так, где я...

49
Как следует интерпретировать сравнение средств из разных размеров выборки?

Возьмите случай с рейтингами книг на сайте. Книгу А оценивают 10000 человек со средним рейтингом 4,25 и дисперсией . Точно так же книга B оценивается 100 людьми и имеет рейтинг 4,5 с .σ=0.5σ=0.5\sigma = 0.5σ=0.25σ=0.25\sigma = 0.25 Теперь из-за большого размера выборки Книги А «среднее значение...

45
Что мы можем сказать о средней численности населения из выборки 1?

Мне интересно, что мы можем сказать, если вообще что-нибудь, о значении населения, когда у меня есть только одно измерение, (размер выборки 1). Очевидно, мы хотели бы иметь больше измерений, но мы не можем их получить.y 1μμ\muy1y1y_1 Мне кажется, что поскольку среднее значение выборки, , тривиально...

43
Какие ссылки следует привести, чтобы использовать 30 как достаточно большой размер выборки?

Я много раз читал / слышал, что размер выборки, по крайней мере, 30 единиц, считается «большой выборкой» (предположения о нормальности средств обычно приблизительно соответствуют CLT, ...). Поэтому в своих экспериментах я обычно генерирую образцы по 30 единиц. Можете ли вы дать мне некоторые...

41
Почему 600 из 1000 убедительнее, чем 6 из 10?

Взгляните на этот отрывок из «Руководства по обучению», Palgrave, 2012, Стеллы Коттрелл, стр. 155: Процентное внимание Обратите внимание, когда проценты даны. Предположим, вместо этого приведенное выше утверждение гласит: 60% людей предпочитали апельсины; 40% сказали, что предпочитают яблоки. Это...

33
Определение размера выборки, необходимого для метода начальной загрузки / Предлагаемый метод

Я знаю, что это довольно горячая тема, на которую никто не может дать простой ответ. Тем не менее мне интересно, если следующий подход не может быть полезным. Метод начальной загрузки полезен только в том случае, если ваша выборка более или менее (читай точно) соответствует тому же распределению,...

32
Почему политические опросы имеют такой большой размер выборки?

Когда я смотрел новости, я заметил, что опросы Гэллапа по таким вещам, как президентские выборы, имеют [я предполагаю случайный] выборочный размер более 1000. Из того, что я помню из статистики колледжа, было то, что размер выборки 30 был «значительно большим». Было сделано впечатление, что размер...

27
Минимальный размер выборки для PCA или FA, когда основной целью является оценка только нескольких компонентов?

Если у меня есть набор данных с наблюдениями и переменными (измерениями), и, как правило, мало ( ), и может варьироваться от маленького ( ) до, возможно, гораздо большего ( ).p n n = 12 - 16 p p = 4 - 10 p = 30 - 50nNnpppnnnn=12−16n=12−16n=12-16pppp=4−10p=4−10p = 4-10p=30−50p=30−50p= 30-50 Я помню,...

26
Каково минимальное рекомендуемое количество групп для фактора случайных эффектов?

Я использую смешанную модель в R( lme4) для анализа некоторых данных повторных измерений. У меня есть переменная реакции (содержание волокна в кале) и 3 фиксированных эффекта (масса тела и т. Д.). В моем исследовании всего 6 участников, по 16 повторных измерений для каждого (хотя у двух только 12...

26
Размер выборки для логистической регрессии?

Я хочу сделать логистическую модель из моих данных опроса. Это небольшой опрос четырех жилых колоний, в котором было опрошено только 154 респондента. Моя зависимая переменная - «удовлетворительный переход к работе». Я обнаружил, что из 154 респондентов 73 сказали, что они успешно перешли на работу,...

24
Проверка работоспособности: насколько низким может быть значение p?

Я использую тест ranksum для сравнения медианы двух образцов ( ) и обнаружили , что они значительно отличаются с: . Должен ли я с подозрением относиться к такому маленькому значению или мне следует отнести его к высокой статистической мощности, связанной с наличием очень большой выборки? Есть ли...

22
Почему выборочное распределение дисперсии является распределением хи-квадрат?

Заявление Распределение выборки дисперсии выборки представляет собой распределение хи-квадрат со степенью свободы, равной , где - размер выборки (учитывая, что интересующая случайная величина обычно распределена).nn−1n−1n-1nnn Источник Моя интуиция Мне это кажется интуитивно понятным: 1) потому что...

22
Как выяснить, какой тип распределения представляет эти данные о времени отклика ping?

Я пробовал реальный процесс, время пинга в сети. «Время прохождения туда-обратно» измеряется в миллисекундах. Результаты представлены на гистограмме: Время пинга имеет минимальное значение, но длинный верхний хвост. Я хочу знать, что это за статистическое распределение, и как оценить его параметры....

21
Показано, что 100 измерений для 5 предметов дают гораздо меньше информации, чем 5 измерений для 100 предметов

На конференции я услышал следующее утверждение: 100 измерений для 5 предметов дают гораздо меньше информации, чем 5 измерений для 100 предметов. Очевидно, что это правда, но мне было интересно, как можно это доказать математически ... Я думаю, что можно использовать линейную смешанную модель. Тем...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

19
Пример распределения, где большой размер выборки необходим для центральной предельной теоремы

Некоторые книги утверждают , образец размер размер 30 или выше , необходимо для центральной предельной теоремы , чтобы дать хорошее приближение для X¯X¯\bar{X} . Я знаю, что этого недостаточно для всех дистрибутивов. Я хотел бы увидеть некоторые примеры распределений, где даже при большом размере...

19
Существует ли статистический тест для сравнения двух выборок размера 1 и 3?

Для экологического проекта моя лабораторная группа добавила уксус в 4 резервуара, содержащих равные объемы прудовой воды, 1 контрольный образец без элодеи (водное растение) и 3 обработки с одинаковым количеством элодеи в каждом. Целью добавления уксуса было снижение рН. Гипотеза заключалась в том,...