Вопросы с тегом «population»

Популяция - это весь набор единиц, из которых может быть составлена ​​выборка.

228
Почему 95% доверительный интервал (КИ) не подразумевает 95% вероятности удержания среднего значения?

Похоже, что из-за различных связанных с этим вопросов существует консенсус, что «95%» часть того, что мы называем «95% доверительный интервал», относится к тому факту, что если бы мы точно повторяли наши процедуры выборки и вычисления CI много раз 95% рассчитанных таким образом КИ будут содержать...

98
Нахождение свободно доступных образцов данных

Я работал над новым методом анализа и анализа наборов данных, чтобы идентифицировать и изолировать подгруппы населения без предварительного знания характеристик какой-либо подгруппы. Хотя этот метод достаточно хорошо работает с искусственными выборками данных (то есть наборами данных, созданными...

50
В чем разница между N и N-1 в расчете дисперсии населения?

Я не понял, почему есть Nи N-1при расчете дисперсии населения. Когда мы используем Nи когда мы используем N-1? Нажмите здесь, чтобы увеличить версию Это говорит о том, что когда население очень большое, нет разницы между N и N-1, но это не говорит о том, почему существует N-1 в начале. Изменить:...

47
Статистический вывод, когда выборка «является» населением

Представьте, что вы должны составлять отчеты о количестве кандидатов, которые ежегодно сдают данный тест. Кажется довольно сложным сделать вывод о наблюдаемом проценте успеха, например, для более широкой популяции из-за специфики целевой популяции. Таким образом, вы можете считать, что эти данные...

29
Статистические методы для данных, где известно только минимальное / максимальное значение

Существует ли какая-либо ветвь статистики, имеющая дело с данными, для которых точные значения неизвестны , но для каждого человека мы знаем максимальную или минимальную привязку к значению ? Я подозреваю, что моя проблема в основном связана с тем, что я изо всех сил пытаюсь сформулировать ее в...

25
Объяснение конечного поправочного коэффициента

Я понимаю, что, когда выборка из конечной совокупности и нашего размера выборки составляет более 5% совокупности, нам необходимо скорректировать среднее значение выборки и стандартную ошибку, используя эту формулу: FпС= N- нN- 1----√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} Где - размер...

14
Оценка численности населения по частоте выборки дубликатов и уникальных

Есть веб-сервис, где я могу запросить информацию о случайном предмете. Для каждого запроса каждый элемент имеет равные шансы на возврат. Я могу продолжать запрашивать предметы и записывать количество дубликатов и уникальных. Как я могу использовать эти данные для оценки общего количества...

14
Bootstrap: проблема переоснащения

Предположим, что кто-то выполняет так называемый непараметрический бутстрап, рисуя выборок размером n каждая из исходных n наблюдений с заменой. Я полагаю, что эта процедура эквивалентна оценке кумулятивной функции распределения по эмпирическому cdf:BBBnnnnnn...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

13
Является ли какое-либо количественное свойство населения «параметром»?

Я относительно знаком с различием между терминами статистика и параметр. Я вижу статистику как значение, полученное от применения функции к образцу данных. Однако большинство примеров параметров относятся к определению параметрического распределения. Типичным примером является среднее значение и...

12
Почему вообще стоит рассматривать выборку без замены в практическом применении?

Выборка с заменой имеет два преимущества перед выборкой без замены: 1) Вам не нужно беспокоиться о конечной коррекции населения. 2) Существует вероятность, что элементы из совокупности отрисовываются несколько раз - тогда вы можете перезапустить измерения и сэкономить время. Конечно, из...

12
Шахматисты мужского и женского пола - ожидаемые расхождения в хвостах раздач

Я заинтересован в выводах этой статьи за 2009 год: Почему (лучшие) женщины так хороши в шахматах? Уровень участия и гендерные различия в интеллектуальных сферах В этой статье делается попытка объяснить, почему самые лучшие шахматисты выглядят намного лучше, чем самые лучшие игроки женского пола...

11
Уклон в среднем возрасте для квалификации звания гроссмейстера по возрастным группам?

Уже давно известно, что самый молодой возраст, когда шахматистам удавалось претендовать на звание гроссмейстера, значительно уменьшился с 1950-х годов, и в настоящее время почти 30 игроков стали гроссмейстерами до своего 15-летия . Однако на бирже шахматных стеков возникает вопрос: каков средний...

10
Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности?

Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности? На мой взгляд, ответ - нет, поскольку мы можем точно рассчитать истинные значения параметров. Но тогда, какова максимальная доля данных от первоначального населения, которая...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

9
Оценка количества шаров путем последовательного выбора шара и его маркировки

Допустим, у меня в сумке N шаров. На моем первом розыгрыше я отмечаю мяч и помещаю его в сумку. Во время второго розыгрыша, если я беру отмеченный мяч, я возвращаю его в сумку. Однако, если я беру безымянный шарик, я отмечаю его и возвращаю в сумку. Я продолжаю это для любого количества розыгрышей....

9
Имеет ли значение, как вы выбираете популяцию?

У меня есть хорошо перемешанный чан с бесконечным количеством мрамора. В чане есть бесконечное количество мрамора, но они бывают только неизвестного, но конечного числа разновидностей : неизвестно, и для рисование мрамора типа может быть более вероятным, чем рисование мрамора типа .k i ≠ j v i v...

9
Параметрический, полупараметрический и непараметрический бутстрап для смешанных моделей

Следующие прививки взяты из этой статьи . Я новичок в начальной загрузке и пытаюсь реализовать параметрическую, полупараметрическую и непараметрическую загрузку начальной загрузки для линейной смешанной модели с R bootпакетом. Код R Вот мой Rкод: library(SASmixed) library(lme4) library(boot)...