Вопросы с тегом «variance»

44
Вычисление дисперсии Коэна (и стандартных ошибок)

Статистика Каппа ( κκ\kappa ) была введена Коэном в 1960 году [1] для измерения согласия между двумя оценщиками. Однако его дисперсия была источником противоречий довольно долгое время. Мой вопрос о том, какой расчет отклонений является лучшим для больших выборок. Я склонен полагать, что...

37
Дисперсия кратных оценок перекрестной проверки как : какова роль «устойчивости»?

TL, DR: кажется, что, вопреки часто повторяемым советам, перекрестная проверка «один-один-один» (LOO-CV), то естькратное CV, где(количество сгибов) равно(число обучающих наблюдений) - дает оценки ошибки обобщения, которые являются наименьшей переменной для любого, а не самой переменной, предполагая...

36
Почему знаменатель оценки ковариации не должен быть n-2, а не n-1?

Знаменатель (несмещенной) оценки дисперсии равен поскольку имеется наблюдений и оценивается только один параметр.n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Кроме того, мне интересно, почему...

35
Как распределение может иметь бесконечное среднее значение и дисперсию?

Было бы желательно, чтобы были приведены следующие примеры: Распределение с бесконечным средним и бесконечной дисперсией. Распределение с бесконечным средним и конечной дисперсией. Распределение с конечным средним и бесконечной дисперсией. Распределение с конечным средним и конечной дисперсией. Это...

35
Почему увеличение размера выборки уменьшает дисперсию (выборку)?

Большая фотография: Я пытаюсь понять, как увеличение размера выборки увеличивает мощность эксперимента. Слайды моего лектора объясняют это картиной из 2 нормальных распределений, одно для нулевой гипотезы и одно для альтернативной гипотезы и порога принятия решения c между ними. Они утверждают, что...

34
Почему существует разница между ручным вычислением 95-процентного доверительного интервала и использованием функции confint () в R?

Дорогие, я заметил нечто странное, что не могу объяснить, не так ли? В итоге: ручной подход к вычислению доверительного интервала в модели логистической регрессии и функция R confint()дают разные результаты. Я проходил Прикладную логистическую регрессию Хосмера и Лемешоу (2-е издание). В 3-й главе...

33
Дисперсия функции одной случайной величины

Допустим, у нас есть случайная величина с известной дисперсией и средним значением. Вопрос в том, какова дисперсия f ( X ) для некоторой заданной функции f. Единственный общий метод, который мне известен, - это дельта-метод, но он дает только приблизительное значение. Теперь меня интересует f ( x )...

33
(Почему) у переоснащенных моделей, как правило, большие коэффициенты?

Я полагаю, что чем больше коэффициент для переменной, тем больше у модели способности «качаться» в этом измерении, обеспечивая повышенную возможность подгонки к шуму. Хотя я думаю, что у меня есть разумное представление о связи между дисперсией в модели и большими коэффициентами, у меня нет такого...

33
Является ли выборочная ковариационная матрица всегда симметричной и положительно определенной?

При вычислении ковариационной матрицы образца гарантируется ли получение симметричной и положительно определенной матрицы? В настоящее время моя задача имеет выборку из 4600 векторов наблюдения и 24...

32
Почему инверсия ковариационной матрицы дает частичные корреляции между случайными величинами?

Я слышал, что частичные корреляции между случайными переменными можно найти, инвертировав ковариационную матрицу и взяв соответствующие ячейки из такой результирующей матрицы точности (этот факт упоминается в http://en.wikipedia.org/wiki/Partial_correlation , но без доказательства) , Почему это...

32
Отклонение от суммы прогнозируемых значений из модели со смешанным эффектом для временных рядов

У меня есть модель смешанного эффекта (фактически обобщенная аддитивная смешанная модель), которая дает мне прогнозы для временных рядов. Чтобы противодействовать автокорреляции, я использую модель corCAR1, учитывая тот факт, что у меня отсутствуют данные. Предполагается, что данные дают мне полную...

32
Дисперсия произведения зависимых переменных

Какова формула для дисперсии произведения зависимых переменных? В случае независимых переменных формула проста: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} = {\rm var}(X){\rm var}(Y)...

32
Как рассчитать объединенную дисперсию двух или более групп с учетом известных групповых дисперсий, средних значений и размеров выборки?

Скажем, есть m+nm+nm+n элементов, разбитых на две группы ( mmm и nnn ). Дисперсия первой группы σ2mσm2\sigma_m^2 и дисперсия второй группы σ2nσn2\sigma^2_n . Предполагается, что сами элементы неизвестны, но я знаю, что означает μmμm\mu_m и μnμn\mu_n . Есть ли способ расчета комбинированной...

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

29
Тест на конечную дисперсию?

Можно ли проверить на конечность (или существование) дисперсии случайной величины для данной выборки? Как ноль, либо {дисперсия существует и является конечной}, либо {дисперсия не существует / бесконечна} будет приемлемым. С философской точки зрения (и в вычислительном отношении) это кажется очень...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

28
Как измерить неравномерность распределения?

Я пытаюсь найти метрику для измерения неравномерности распределения для эксперимента, который я провожу. У меня есть случайная переменная, которая должна быть равномерно распределена в большинстве случаев, и я хотел бы иметь возможность идентифицировать (и, возможно, измерить степень) примеры...