Вопросы с тегом «chi-squared»

14
Распределение свертки квадратов нормальных и хи-квадрат переменных?

Следующая проблема возникла недавно при анализе данных. Если случайная величина X следует нормальному распределению, а Y следует распределению χ2nχn2\chi^2_n (с n dof), как распределяется Z=X2+Y2Z=X2+Y2Z = X^2 + Y^2 ? До сих пор я придумал ПРВ Y2Y2Y^2 :...

13
Применимость критерия хи-квадрат, если многие ячейки имеют частоты менее 5

Чтобы найти связь между поддержкой сверстников (независимая переменная) и удовлетворенностью работой (зависимая переменная), я хочу применить критерий хи-квадрат. Поддержка сверстников - это категории в четырех группах в зависимости от степени поддержки: 1 = очень меньшая степень, 2 = в некоторой...

13
Понимание критерия хи-квадрат и распределения хи-квадрат

Я пытаюсь понять логику теста хи-квадрат. Критерий хи-квадрат равен . Затем сравнивается с распределением хи-квадрат, чтобы определить значение p., чтобы отклонить или не принять нулевую гипотезу. : наблюдения получены из распределения, которое мы использовали для создания наших ожидаемых значений....

13
Можно ли использовать квадрат Чи для сравнения пропорций?

Я читал, что тест хи-квадрат полезен, чтобы увидеть, значительно ли образец отличается от набора ожидаемых значений. Например, вот таблица результатов опроса относительно любимых цветов людей (всего n = 15 + 13 + 10 + 17 = 55 респондентов): red,blue,green,yellow 15,13,10,17 Тест хи-квадрат может...

13
LARS против координатного спуска для лассо

Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Регулировка значения p для адаптивного последовательного анализа (для теста хи-квадрат)?

Я хотел бы знать, какая статистическая литература имеет отношение к следующей проблеме, и, возможно, даже идея о том, как ее решить. Представьте себе следующую проблему: У нас есть 4 возможных лечения некоторых заболеваний. Чтобы проверить, какое лечение лучше, мы проводим специальное исследование....

12
-test В.С. -test для сравнения шансов подхватить простуду в 2 -х группах

Я только что прочитал в довольно уважаемом (популярном) научном журнале (немецкий PM, 02/2013, с.36) об интересном эксперименте (к сожалению, без источника). Это привлекло мое внимание, потому что интуитивно я сомневался в значимости результата, но предоставленной информации было достаточно для...

12
Почему в тесте независимости используется распределение хи-квадрат?

В тесте на соответствие критерия используется следующая статистика : В тесте предоставление этого условия выполнены, как используются - распределение для вычисления р-значение, учитывая правда можно было бы наблюдать такое значение в репрезентативной выборке одного и того же...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...

11
Как я могу адаптировать ANOVA для двоичных данных?

У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который...

11
Тонкость р-значения: больше-равно против больше

Когда я читаю книгу Вассермана «Вся статистика», я замечаю тонкую тонкость в определении p-значений, которую я не могу понять. Неформально Вассерманн определяет значение p как [..] вероятность (ниже H0H0H_0 ) наблюдения значения тестовой статистики такая же или более экстремальная, чем на самом...

11
Распределение отношения зависимых хи-квадрат случайных величин

Предположим, что где независимы.X=X1+X2+⋯+XnX=X1+X2+⋯+Xn X = X_1 + X_2+\cdots+ X_n Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim N(0,\sigma^2) Мой вопрос, что делает распределение Z=X2X21+X22+⋯+X2nZ=X2X12+X22+⋯+Xn2 Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2} следовать? Отсюда я знаю, что отношение двух...

11
Для какого типа выбора можно использовать критерий хи-квадрат?

Здесь я спрашиваю о том, что обычно делают другие, чтобы использовать критерий хи-квадрат для выбора функции по результатам в контролируемом обучении. Если я правильно понимаю, проверяют ли они независимость между каждой функцией и результатом и сравнивают значения p между тестами для каждой...

11
Упорядочить статистику (например, минимум) бесконечного набора переменных хи-квадрат?

Это мой первый раз здесь, поэтому, пожалуйста, дайте мне знать, если я смогу уточнить свой вопрос каким-либо образом (включая форматирование, теги и т. Д.). (И, надеюсь, я смогу редактировать позже!) Я пытался найти ссылки и пытался решить сам, используя индукцию, но потерпел неудачу в обоих...

11
Как интерпретировать остаточные цвета на мозаичном графике?

Это мозаичный график набора данных таблицы сопряженности, HairEyeColorописанный здесь . Как мне интерпретировать цвета, представляющие остатки? В чем разница между высокими и положительными остатками Пирсона (показаны синим цветом) по сравнению с низкими и отрицательными, показанными красным...

11
Почему в тесте Макнемара используется хи-квадрат, а не нормальное распределение?

Я только что заметил, как в неточном тесте Макнемара используется асимптотическое распределение хи-квадрат. Но поскольку точный тест (для таблицы двух случаев) основан на биномиальном распределении, почему не принято предлагать нормальное приближение к биномиальному распределению?...

11
Какой тест для анализа перекрестных таблиц: Boschloo или Barnard?

Я анализирую таблицу 2х2 из небольшого набора данных из 30 пациентов. Мы ретроспективно пытаемся найти некоторые переменные, которые дают подсказку о том, какое лечение выбрать. Переменные (общепринятые / странные) и решение о лечении (A / B) представляют особый интерес, и поэтому данные выглядят...