Вопросы с тегом «mean»

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

14
Как называется среднее из самых больших и самых маленьких значений в данном наборе данных?

Что вы называете статистическим средним, которое вычисляется из верхних и нижних крайних значений в любом данном наборе данных? Например, если у вас есть набор: { -2, 0 , 8, 9, 1, 50, -2, 6} Верхний предел этого набора равен 50нижнему пределу -2. Таким образом, среднее значение крайностей будет(-2...

14
Регрессия к среднему значению в «Мышление, быстро и медленно»

В Размышлении быстро и медленно» Даниэль Канеман ставит следующий гипотетический вопрос: (Стр. 186). Джули в настоящее время является старшим в государственном университете. Она бегло читала, когда ей было четыре года. Какой у нее средний балл (GPA)? Его намерение состоит в том, чтобы...

14
Карет глмнет против cv.glmnet

Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с...

14
Следует ли использовать среднее значение при перекосе данных?

Часто вводные тексты по прикладной статистике отличают среднее от медианного (часто в контексте описательной статистики и мотивации суммирования центральной тенденции с использованием среднего, медианного значения и режима), объясняя, что среднее значение чувствительно к выбросам в данных выборки и...

14
Сверхдисперсия в логистической регрессии

Я пытаюсь понять концепцию чрезмерной дисперсии в логистической регрессии. Я читал, что избыточная дисперсия - это когда наблюдаемая дисперсия переменной отклика больше, чем можно было бы ожидать от биномиального распределения. Но если биномиальная переменная может иметь только два значения (1/0),...

13
Уместно ли отобразить среднее значение в гистограмме?

Можно ли добавить вертикальную линию к гистограмме для визуализации среднего значения? Мне кажется, это нормально, но я никогда не видел этого в учебниках и тому подобном, поэтому мне интересно, есть ли какое-то соглашение не делать этого? График предназначен для курсовой работы, я просто хочу...

13
Определение истинного среднего из шумных наблюдений

У меня есть большой набор точек данных в форме (значит, stdev). Я хочу уменьшить это значение до одного (лучшего) среднего и (надеюсь) меньшего стандартного отклонения. Очевидно , я мог бы просто вычислить , однако это не принимает во внимание тот факт, что некоторые из точек данных значительно...

13
Какова максимальная функция плотности вероятности энтропии для положительной непрерывной переменной заданного среднего значения и стандартного отклонения?

Каково максимальное распределение энтропии для положительной непрерывной переменной с учетом ее первого и второго моментов? Например, гауссово распределение является максимальным распределением энтропии для неограниченной переменной, учитывая ее среднее значение и стандартное отклонение, а...

13
Гармоническое среднее минимизирует сумму квадратов относительных ошибок

Я ищу ссылку, где доказано, что гармоническое среднее x¯h=n∑ni=11xix¯h=n∑i=1n1xi\bar{x}^h = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}} минимизирует (в zzz ) сумму квадратов относительных ошибок ∑i=1n((xi−z)2xi).∑i=1n((xi−z)2xi).\sum_{i=1}^n \left( \frac{(x_i -...

13
Стандартное отклонение нескольких измерений с неопределенностью

У меня есть два 2 часа данных GPS с частотой дискретизации 1 Гц (7200 измерений). Данные приведены в форме , где - погрешность измерения.(X,Xσ,Y,Yσ,Z,Zσ)(X,Xσ,Y,Yσ,Z,Zσ)(X, X_\sigma, Y, Y_\sigma, Z, Z_\sigma)NσNσN_\sigma Когда я беру среднее из всех измерений (например, среднее значение Z за эти...

12
Проверка гипотезы на разницу в медиане между более чем двумя образцами

Вопрос Результаты тестов трех групп людей сохраняются в виде отдельных векторов в R. set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) Я хочу знать, есть ли значительная разница в медиане между этими...

12
Можно ли рассчитать стандартное отклонение для среднего гармонического?

Можно ли рассчитать стандартное отклонение для среднего гармонического? Я понимаю, что стандартное отклонение может быть рассчитано для среднего арифметического, но если у вас есть среднее гармоническое, как вы рассчитываете стандартное отклонение или...

12
Рассчитать доверительный интервал для среднего бета-распределения

Рассмотрим бета-распределение для данного набора рейтингов в [0,1]. После расчета среднего значения: μ=αα+βμ=αα+β \mu = \frac{\alpha}{\alpha+\beta} Есть ли способ обеспечить доверительный интервал вокруг этого среднего...

12
Как я могу интерпретировать график процента усечения относительно среднего значения?

Для части домашнего задания меня попросили вычислить усеченное среднее для набора данных, удалив самое маленькое и самое большое наблюдение, и интерпретировать результат. Среднее значение было ниже, чем среднее значение. Моя интерпретация заключалась в том, что это произошло потому, что базовое...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...