Вопросы с тегом «mean»

30
Существует ли надежный непараметрический доверительный интервал для среднего перекошенного распределения?

Очень искаженные распределения, такие как log-normal, не дают точных доверительных интервалов начальной загрузки. Вот пример, показывающий, что левая и правая области хвоста далеки от идеальных 0,025 независимо от того, какой метод начальной загрузки вы используете в R: require(boot) n <- 25 B...

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

29
Как рассчитать взвешенное стандартное отклонение? В Excel?

Итак, у меня есть набор данных процентов, например, так: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) Я хочу найти стандартное отклонение в процентах, но взвешенное для их объема данных. т.е. первая и последняя точки данных должны доминировать в расчете. Как...

29
Регресс к среднему значению против заблуждения игрока

С одной стороны, у меня есть регресс к среднему значению, а с другой - у меня ошибка игрока . Ошибка Игрока определяется Миллером и Санджурджо (2019) как «ошибочное убеждение, что случайные последовательности имеют систематическую тенденцию к развороту, то есть, что полосы схожих результатов скорее...

27
Могут ли степени свободы быть нецелым числом?

Когда я использую GAM, он дает мне остаточный DF, (последняя строка в коде). Что это значит? Выходя за рамки примера GAM, в общем, может ли число степеней свободы быть нецелым числом?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data =...

26
Чем нахождение центроида отличается от нахождения среднего значения?

При выполнении иерархической кластеризации можно использовать множество метрик для измерения расстояния между кластерами. Две такие метрики подразумевают вычисление центроидов и средних точек данных в кластерах. В чем разница между средним и центроидом? Разве это не одна и та же точка в...

26
Как вычислить доверительный интервал отношения двух нормальных средних

Я хочу вывести пределы для доверительного интервала для отношения двух средних. Предположим, что и независимы, среднее отношение . Я пытался решить: но это уравнение не может быть решено во многих случаях (без корней). Я делаю что-то неправильно? Есть ли лучший подход? БлагодарностьX 1 ∼ N ( θ 1 ,...

24
Что можно сделать вывод о данных, когда среднее арифметическое очень близко к среднему геометрическому?

Есть ли что-то существенное в среднем геометрическом и среднем арифметическом значении, которое находится очень близко друг к другу, скажем, ~ 0,1%? Какие предположения можно сделать о таком наборе данных? Я работал над анализом набора данных и заметил, что по иронии судьбы значения очень и очень...

23
Как определить, симметрично ли распределение данных?

Я знаю, что если медиана и среднее значение приблизительно равны, то это означает, что существует симметричное распределение, но в данном конкретном случае я не уверен. Среднее значение и медиана довольно близки (разница составляет всего 0,487 м / галл), что заставляет меня сказать, что существует...

22
Почему среднее значение более стабильно в разных выборках, чем в среднем?

Раздел 1.7.2 Обнаружения Статистики Используя R Энди Филдсом и др., Перечисляя достоинства среднего значения по отношению к медиане, утверждает: ... среднее значение стабильно в разных выборках. Это после объяснения многих достоинств медианы, например, ... Медиана относительно не зависит от...

22
Коррекция смещения во взвешенной дисперсии

Для невзвешенной дисперсии существует дисперсия выборки с поправкой на смещение, когда среднее значение было оценено по тем же данным: Var(X):=1Вар ( Х) : = 1NΣя( хя- μ )2Var(Икс)знак равно1NΣя(Икся-μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Вар ( Х) : = 1n - 1Σя( хя- E[ X] )2Var(Икс)знак...

21
Как рассчитать доверительные интервалы для ненормального распределения?

У меня 383 выборки с большим смещением для некоторых распространенных значений. Как рассчитать 95% ДИ для среднего значения? CI, который я рассчитал, кажется далёким, и я предполагаю, что мои данные не выглядят как кривая, когда я делаю гистограмму. Так что я думаю, что должен использовать что-то...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

20
Является ли медиана типом среднего для некоторого обобщения «среднего»?

Понятие «среднее» бродит гораздо шире, чем традиционное среднее арифметическое; это простирается так далеко, чтобы включить медиану? По аналогии необработанные данные ⟶Я бынеобработанные данные ⟶жадныйсырое среднее ⟶Я бы- 1среднее арифметическоенеобработанные данные ⟶Recipвзаимные ⟶жадныйзначит...

20
Рассчитать среднее по порядковой переменной

Я читал во многих местах, что вычисление среднего значения порядковой переменной неуместно. Я пытаюсь понять, почему это может быть неуместно. Я думаю, это потому, что, как правило, порядковая переменная обычно не распределяется, и поэтому вычисление среднего значения даст неточное представление....

20
Как мы можем моделировать из геометрической смеси?

Если - известные плотности, из которых я могу смоделировать, т. Е. Для которых доступен алгоритм. и если продукт является интегрируемым, существует ли общий подход для моделирования на основе этой плотности продукта с использованием симуляторы от ?k ∏ i = 1 f i ( x ) α...

20
Почему минимизация MAE приводит к прогнозированию медианы, а не среднего значения?

Из учебника « Прогнозирование: принципы и практика » Роба Хиндмана и Джорджа Афанасопулоса , в частности, раздел об измерении точности : Прогнозный метод, который минимизирует MAE, приведет к прогнозам медианы, а минимизация RMSE приведет к прогнозам среднего значения. Может ли кто-то дать...

20
Усреднение значений корреляции

Допустим, я проверяю, как переменная Yзависит от переменной Xв различных экспериментальных условиях, и получаю следующий график: Штриховые линии на графике выше представляют линейную регрессию для каждого ряда данных (экспериментальная установка), а цифры в легенде обозначают корреляцию Пирсона для...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...