Вопросы с тегом «sampling»

27
Могут ли степени свободы быть нецелым числом?

Когда я использую GAM, он дает мне остаточный DF, (последняя строка в коде). Что это значит? Выходя за рамки примера GAM, в общем, может ли число степеней свободы быть нецелым числом?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data =...

25
Стандартное отклонение бин-наблюдений

У меня есть набор данных наблюдений за образцами, которые хранятся в виде отсчетов в пределах диапазона. например: min/max count 40/44 1 45/49 2 50/54 3 55/59 4 70/74 1 Теперь найти среднюю оценку из этого довольно просто. Просто используйте среднее значение (или медиану) каждого бина диапазона в...

25
Как оценить, сколько людей посетило мероприятие (скажем, политический митинг)?

Один студент спросил меня сегодня: «Как они узнают, сколько людей посетили большое групповое мероприятие, например,« Ралли Стюарта / Колберта по восстановлению здравомыслия »в Вашингтоне?» Новостные агентства сообщают, что оценки исчисляются десятками тысяч, но какие методы используются для...

25
Объяснение конечного поправочного коэффициента

Я понимаю, что, когда выборка из конечной совокупности и нашего размера выборки составляет более 5% совокупности, нам необходимо скорректировать среднее значение выборки и стандартную ошибку, используя эту формулу: FпС= N- нN- 1----√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} Где - размер...

25
Чертеж из дистрибутива Дирихле

Допустим, у нас есть распределение Дирихле с мерным векторным параметром . Как я могу нарисовать образец ( мерный вектор) из этого распределения? Мне нужно (возможно) простое объяснение.КKKКα⃗ = [ α1, α2, . , , , αК]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1,...

24
Парадокс данных iid (по крайней мере для меня)

Насколько позволяют мои совокупные (и скудные) знания по статистике, я понял, что если - это случайные переменные, то, как следует из этого термина, они независимы и одинаково распределены.X1,X2,...,XnX1,X2,...,XnX_1, X_2,..., X_n Здесь меня интересует прежнее свойство примеров iid, которое гласит:...

24
Можно ли анализировать неслучайные выборки с помощью стандартных статистических тестов?

Многие клинические исследования основаны на неслучайных выборках. Однако большинство стандартных тестов (например, t-тесты, ANOVA, линейная регрессия, логистическая регрессия) основаны на предположении, что выборки содержат «случайные числа». Являются ли результаты действительными, если эти...

24
Расчет предельной вероятности по образцам MCMC

Это повторяющийся вопрос (см. Этот пост , этот пост и этот пост ), но у меня другое вращение. Предположим, у меня есть набор сэмплов из стандартного сэмплера MCMC. Для каждого образца я знаю значение вероятности записи в журнал и предшествующего . Если это помогает, я также знаю значение...

23
Должна ли выборка для логистической регрессии отражать реальное соотношение 1 и 0?

Предположим, я хочу создать модель логистической регрессии, которая может оценить вероятность появления некоторых видов животных, живущих на деревьях, на основе характеристик деревьев (например, высоты). Как всегда, мое время и деньги ограничены, поэтому я могу собрать только ограниченный размер...

22
Каковы предположения о тесте перестановки?

Часто утверждается, что тесты перестановок не имеют никаких предположений, однако это, безусловно, не так. Например, если мои образцы как-то коррелируют, я могу представить, что перестановка их меток не будет правильной вещью. Единственное, что я обнаружил в этой проблеме, - это предложение из...

22
Почему выборочное распределение дисперсии является распределением хи-квадрат?

Заявление Распределение выборки дисперсии выборки представляет собой распределение хи-квадрат со степенью свободы, равной , где - размер выборки (учитывая, что интересующая случайная величина обычно распределена).nn−1n−1n-1nnn Источник Моя интуиция Мне это кажется интуитивно понятным: 1) потому что...

22
Генерация данных с заданной выборочной ковариационной матрицей

Учитывая ковариационную матрицу , как сгенерировать данные таким образом, чтобы они имели образец ковариационной матрицы \ hat {\ boldsymbol \ Sigma} = \ boldsymbol \ Sigma_s ?ΣsΣs\boldsymbol \Sigma_sΣ^=ΣsΣ^=Σs\hat{\boldsymbol \Sigma} = \boldsymbol \Sigma_s В более общем плане: мы часто...

22
Выборка для несбалансированных данных в регрессии

Были хорошие вопросы об обработке несбалансированных данных в контексте классификации , но мне интересно, что люди делают, чтобы выбрать регрессию. Скажем, проблемный домен очень чувствителен к знаку, но лишь несколько чувствителен к величине цели. Однако величина достаточно важна, чтобы модель...

21
Может ли кто-нибудь помочь объяснить разницу между независимым и случайным?

В статистике описывают ли независимые и случайные одинаковые характеристики? Какая разница между ними? Мы часто сталкиваемся с описанием типа «две независимые случайные величины» или «случайная выборка». Мне интересно, какова точная разница между ними. Может кто-нибудь объяснить это и привести...

21
Я только что изобрел байесовский метод для анализа кривых ROC?

преамбула Это длинный пост. Если вы перечитываете это, обратите внимание, что я пересмотрел часть вопроса, хотя исходные материалы остались прежними. Кроме того, я считаю, что разработал решение проблемы. Это решение появляется в нижней части поста. Спасибо CliffAB за то, что он указал, что мое...

21
Bootstrapping vs Bayesian Bootstrapping концептуально?

У меня проблемы с пониманием, что такое байесовский процесс начальной загрузки, и чем он отличается от вашей обычной начальной загрузки. И если бы кто-то мог предложить интуитивно-концептуальный обзор и сравнение того и другого, это было бы здорово. Давайте возьмем пример. Скажем, у нас есть набор...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

20
Моделирование временных рядов с учетом мощности и кросс-спектральных плотностей

У меня возникают проблемы при создании набора стационарных цветных временных рядов, учитывая их ковариационную матрицу (их спектральные плотности мощности (PSD) и спектральные плотности перекрестных мощностей (CSD)). Я знаю, что, учитывая два временных ряда и , я могу оценить их спектральные...

20
Какова стандартная ошибка стандартного отклонения образца?

Я прочитал оттуда, что стандартная ошибка выборочной дисперсии SEs2=2σ4N−1−−−−−−√SEs2=2σ4N−1SE_{s^2} = \sqrt{\frac{2 \sigma^4}{N-1}} Какова стандартная ошибка стандартного отклонения образца? Я хотел бы догадаться и сказать, что но я не уверен.SEs=SEs2−−−−√SEs=SEs2SE_{s} =...