Вопросы с тегом «variance»

10
Как мы можем узнать дисперсию населения?

При проверке гипотез, общий вопрос - что такое популяционная дисперсия? Мой вопрос: как мы можем узнать разницу населения? Если бы мы знали все распределение, мы могли бы также знать среднее значение для всего населения. Тогда какой смысл в проверке...

10
Как получить «собственные значения» (проценты объясненной дисперсии) векторов, которые не являются собственными векторами PCA?

Я хотел бы понять, как я могу получить процент дисперсии набора данных не в координатном пространстве, предоставленном PCA, а по отношению к немного другому набору (повернутых) векторов. set.seed(1234) xx <- rnorm(1000) yy <- xx * 0.5 + rnorm(1000, sd = 0.6) vecs <- cbind(xx, yy)...

10
В моделях Normal и Binomial всегда задняя дисперсия меньше предыдущей дисперсии?

Или какие условия это гарантируют? В целом (и не только для нормальных и биномиальных моделей) я полагаю, что главная причина, которая нарушила это утверждение, состоит в том, что существует несоответствие между моделью выборки и предыдущей, но что еще? Я начинаю с этой темы, поэтому я очень ценю...

10
Как измерить дисперсию в данных частоты слов?

Как я могу определить количество дисперсии в векторе количества слов? Я ищу статистику, которая будет высокой для документа A, потому что она содержит много разных слов, которые встречаются редко, и низкой для документа B, потому что она содержит одно слово (или несколько слов), которые встречаются...

10
Интуиция за формулой для дисперсии суммы двух переменных

Я знаю из предыдущих исследований, что Var(A+B)=Var(A)+Var(B)+2Cov(A,B)Вaр(A+В)знак равноВaр(A)+Вaр(В)+2Соv(A,В)Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B) Однако я не понимаю, почему это так. Я вижу, что эффект будет «увеличивать» дисперсию, когда А и В сильно коваризуются. Имеет смысл, что, когда вы...

9
Лучшие практики при обработке данных о дальности как непрерывных

Я смотрю на то, связано ли изобилие с размером. Размер (конечно) непрерывен, однако, численность записывается в таком масштабе, что A = 0-10 B = 11-25 C = 26-50 D = 51-100 E = 101-250 F = 251-500 G = 501-1000 H = 1001-2500 I = 2501-5000 J = 5001-10,000 etc... А через Q ... 17 уровней. Я думал, что...

9
Параметрический, полупараметрический и непараметрический бутстрап для смешанных моделей

Следующие прививки взяты из этой статьи . Я новичок в начальной загрузке и пытаюсь реализовать параметрическую, полупараметрическую и непараметрическую загрузку начальной загрузки для линейной смешанной модели с R bootпакетом. Код R Вот мой Rкод: library(SASmixed) library(lme4) library(boot)...

9
Как сравнить наблюдаемые и ожидаемые события?

Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот моих четырех событий (18) я могу рассчитать ожидаемые частоты...

9
Коробка Кокса Преобразования для регрессии

Я пытаюсь согласовать линейную модель с некоторыми данными только одним предиктором (скажем, (x, y)). Данные таковы, что для малых значений x значения y обеспечивают плотное прилегание к прямой линии, однако при увеличении значений x значения y становятся более изменчивыми. Вот пример таких данных...

9
Нулевая гипотеза Манна-Уитни при неравной дисперсии

Мне просто интересно узнать о нулевой гипотезе U-критерия Манна-Уитни. Я часто вижу, что утверждалось, что нулевая гипотеза состоит в том, что две популяции имеют равные распределения. Но я думаю - если бы у меня было две нормальные популяции с одинаковым средним, но крайне неравным отклонением,...

9
Нахождение дисперсии оценки для максимального правдоподобия для распределения Пуассона

Если - это распределения Пуассона с параметром я определил, что максимальная оценка вероятности равна для данных . Поэтому мы можем определить соответствующий оценщик Мой вопрос: как бы вы определили дисперсию этой оценки? & beta ; & beta ; ( к 1 , ... , K п ) = 1К1, … , КNК1,...,КNK_1,...

9
Дисперсия среднего значения выборки начальной загрузки

Пусть быть отчетливым наблюдением (без связей). Пусть X * 1 , . , , , Х * п обозначает образец самозагрузки (образец из эмпирической CDF) и пусть ˉ Х * п = 1Икс1, . , , , XNX1,...,XnX_{1},...,X_{n}Икс*1, . , , , X*NX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*} . НайтиE( ˉ X ∗ n )иVar( ˉ X ∗ n ).Икс¯*N= 1NΣNя...

9
Вращайте компоненты PCA, чтобы выровнять дисперсию в каждом компоненте

Я пытаюсь уменьшить размерность и шум набора данных, выполняя PCA для набора данных и выбрасывая последние несколько ПК. После этого я хочу использовать некоторые алгоритмы машинного обучения на оставшихся ПК, и поэтому я хочу нормализовать данные путем выравнивания дисперсии ПК, чтобы алгоритмы...

9
Какая модель глубокого обучения может классифицировать категории, которые не являются взаимоисключающими

Примеры: у меня есть предложение в должностной инструкции: «Старший инженер Java в Великобритании». Я хочу использовать модель глубокого обучения, чтобы предсказать ее как 2 категории: English и IT jobs. Если я использую традиционную классификационную модель, она может предсказать только 1 метку с...

9
Разброс отклонения: термин для ожидаемой квадратической ошибки прогноза за вычетом неснижаемой ошибки

Hastie et al. «Элементы статистического обучения» (2009) рассматривают процесс генерирования данных с E ( ε ) = 0 и Var ( ε ) = σ 2 ε .Y= ф( Х) + εY=f(X)+ε Y = f(X) + \varepsilon E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Они представляют...

9
Является ли свойство инвариантности оценки ML бессмысленным с точки зрения Байеса?

Каселла и Бергер утверждают свойство инвариантности оценки ML следующим образом: Тем не менее, мне кажется, что они определяют «вероятность» совершенно случайным и бессмысленным образом:ηη\eta Если я применяю основные правила теории вероятностей к простому случаю, когда , я получаю следующее: L ( η...

9
Для какой проблемы или игры оптимальным решением являются дисперсия и стандартное отклонение?

Для заданной случайной величины (или совокупности, или стохастического процесса) математическое ожидание является ответом на вопрос: какой точечный прогноз минимизирует ожидаемую квадратичную потерю? , Кроме того, это оптимальное решение для игры. Угадайте следующую реализацию случайной величины...

8
Почему этот набор данных не имеет ковариации?

Мое понимание того, как работает ковариация, заключается в том, что коррелированные данные должны иметь несколько высокую ковариацию. Я сталкивался с ситуацией, когда мои данные выглядят коррелированными (как показано на диаграмме рассеяния), но ковариация близка к нулю. Как ковариация данных может...