Вопросы с тегом «hypothesis-testing»

10
Сравните R-квадрат из двух разных моделей Random Forest

Я использую пакет randomForest в R для разработки модели случайного леса, чтобы попытаться объяснить непрерывный результат в «широком» наборе данных с большим количеством предикторов, чем выборок. В частности, я подгоняю одну модель RF, позволяющую процедуре выбрать из набора ~ 75 переменных...

10
Можем ли мы сравнить корреляции между группами, сравнивая наклоны регрессии?

В этом вопросе они спрашивают, как сравнить Pearson r для двух независимых групп (таких как мужчины против женщин). Ответ и комментарии предложены двумя способами: Используйте известную формулу Фишера, используя "z-transformation" of r; Используйте сравнение уклонов (коэффициенты регрессии)....

10
Когда использовать распределение Стьюдента или Нормального в линейной регрессии?

Я смотрю на некоторые проблемы, а в некоторых, чтобы проверить коэффициенты, иногда я вижу людей, использующих распределение Стьюдента, а иногда я вижу Нормальное распределение. Какое...

10
Проверка гипотез и общее расстояние изменения против расхождения Кульбака-Лейблера

В своем исследовании я столкнулся со следующей общей проблемой: у меня есть два распределения и в одной и той же области и большое (но конечное) число выборок из этих распределений. Выборки независимо и идентично распределяются из одного из этих двух распределений (хотя распределения могут быть...

10
Тест на пропорции и двоичный классификатор

У меня есть прототип машины, производящей детали. В первом тесте машина производит деталей, и двоичный классификатор говорит мне, что детали неисправны ( , обычно и ), а детали хороши.d 1 d 1 < N 1 d 1 / N 1 < 0,01 N 1 ≈ 10 4 N 1 - d 1N1N1N_1d1d1d_1d1< N1d1<N1d_1 < N_1d1/ N1<...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

10
Проверка гипотез на обратной ковариационной матрице

Предположим, я наблюдаю iid и хочу проверить vech для согласованной матрицы и вектора . Известны ли работы по этой проблеме?Икся∼ N( μ , Σ )Икся~N(μ,Σ)x_i \sim \mathcal{N}\left(\mu,\Sigma\right)( Σ - 1 ) = a A aЧАС0: A ЧАС0:A H_0: A\ ( Σ- 1) =а(Σ-1)знак равноa\left(\Sigma^{-1}\right) = aAAAaaa...

10
Является ли наблюдаемая частота аллелей значительно меньше предсказанной?

Вопрос : Как я могу построить тест, чтобы определить, является ли наблюдаемая частота "горных" аллелей (Рис. 1) значительно ниже в центральных и южных горах, чем прогнозируется (Рис. 2) моделью экологического отбора ( подробности см. Ниже )? Проблема : Моя первоначальная мысль состояла в том, чтобы...

10
Обнаружение кластеров «похожих» исходников

Предположим, у меня 400 студентов (это в большом университете), которые должны заниматься компьютерными проектами, и что они должны работать в одиночку (без группы студентов). Примером проекта может быть «реализация алгоритма быстрого преобразования Фурье в Фортране» (я знаю, это не звучит...

10
Критические значения Вилкоксона-Манна-Уитни в R

Я заметил, что когда я пытаюсь найти критические значения для Манна-Уитни U, используя R, значения всегда 1 + критическое значение. Например, для критическое значение (двусторонний) равно 8, а для α = 0,05 , n = 12 , m = 8 критическое (двустороннее) значение равно 22 (проверьте таблицы ), но:α =...

10
Анализ мощности для биномиальных данных, когда нулевая гипотеза состоит в том, что

Я хотел бы провести анализ мощности для одной выборки из биномиальных данных, с , по сравнению с , где - это доля успехов в популяции. Если , я мог бы использовать либо нормальное приближение к биномиальному, либо -test, но при оба эти значения не пройдены. Я хотел бы знать, есть ли способ сделать...

10
Статистическое тестирование

Мне нужно найти соответствующий статистический тест (тест отношения правдоподобия, t-тест и т. Д.) По следующему: Позвольте быть IID образец случайного вектора ( X , Y ) и предположим , что ( У Х ) ~ N [ ( μ 1 μ 2 ) , ( 1 0,5 0,5 1 ) ] . Гипотезы: H 0 = μ 1 + μ{ Xя; Yя}Nя =...

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Есть ли общее определение величины эффекта?

У effect-sizeтега нет вики. Страница википедии о размере эффекта не дает точного общего определения. И я никогда не видел общего определения величины эффекта . Однако, читая некоторые дискуссии, подобные этой, у меня складывается впечатление, что люди имеют в виду общее представление о величине...

10
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

10
Соответствует ли это единственное значение тому распределению?

это похоже на очень наивный вопрос, но мне трудно увидеть ответ. У меня есть один набор из 30 значений. Самостоятельно я получил 31-е значение. Нулевая гипотеза состоит в том, что 31-е значение является частью одного и того же распределения. Альтернатива в том, что это другое. Я хочу какую-то...

10
В чем преимущество использования перестановочных тестов?

При проверке некоторых нулевых и альтернативных гипотез с помощью тестовой статистики , где , примените тест перестановки с набором перестановок на и мы получим новую статистику Х = { х я , . , , , x n } G X T ( X ) : = # { π ∈ G : U ( π X ) ≥ U ( X ) }U(X)U(X)U(X)X={xi,...,xn}X={xi,...,xn}X = \{...

10
Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности?

Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности? На мой взгляд, ответ - нет, поскольку мы можем точно рассчитать истинные значения параметров. Но тогда, какова максимальная доля данных от первоначального населения, которая...

10
Должен ли я использовать приблизительные степени свободы Уэлча (1947) или Satterthwaite (1946)?

Меня смущает правильная формула приблизительных степеней свободы, которую можно использовать для t-теста Уэлча. Формула Satterthwaite (1946) - это наиболее часто цитируемая формула, но Уэлч дал альтернативу в 1947 году. Я не уверен, что является предпочтительным (или используется большинством...

10
Что такое исправления Гомеля Хохберга?

Недавно я познакомился с исправлениями Гомеля Хохберга. Я пытаюсь найти простое объяснение того, что это на самом деле / ​​делает, но мне не повезло. Может ли кто-нибудь дать краткое и простое описание поправок Гомеля...