Вопросы с тегом «goodness-of-fit»

12
Насколько хороша моя модель, основанная на значении диагностической метрики (

Я установил свою модель и пытаюсь понять, хороша ли она. Я рассчитал рекомендуемые показатели для его оценки ( / AUC / точность / ошибка прогнозирования / и т. Д.), Но не знаю, как их интерпретировать. Короче говоря, как мне определить, хороша ли моя модель по метрике? Достаточно ли 0,6 (например),...

12
Пригодность для очень больших размеров выборки

Я собираю очень большие выборки (> 1 000 000) категориальных данных каждый день и хочу, чтобы данные выглядели «существенно» по-разному в разные дни, чтобы обнаружить ошибки в сборе данных. Я подумал, что для этого пригодится тест на пригодность (в частности, G-тест). Ожидаемое распределение...

12
Как читать добро подходят по NLS R?

Я пытаюсь интерпретировать вывод nls (). Я прочитал этот пост, но я все еще не понимаю, как выбрать наиболее подходящий. Из моих припадок у меня есть два выхода: > summary(m) Formula: y ~ I(a * x^b) Parameters: Estimate Std. Error t value Pr(>|t|) a 479.92903 62.96371 7.622 0.000618 *** b...

11
«Обратный» Шапиро – Вилк

Тест Шарипо-Вилка, согласно википедии , проверяет нулевую гипотезу ( ) «Население обычно распределено».ЧАС0ЧАС0H_0 Я ищу похожий тест на нормальность с «Население обычно не распределено».ЧАС0ЧАС0H_0 Имея такой тест, я хочу вычислить значение, чтобы отклонить H 0 на уровне значимости α тогда и...

11
Могу ли я проверить гипотезу для искаженных нормальных данных?

У меня есть набор данных, который, как я думал, изначально был распространен. Затем я на самом деле посмотрел на это и понял, что это не так, в основном из-за того, что данные искажены, и я также провел тест Шапиро-Уилкса. Я все еще хотел бы проанализировать это, используя статистические методы, и...

11
Мера «отклонения» для Пуассона с нулевым надуванием или отрицательного бинома с нулевым надуванием?

Масштабное отклонение, определяемое как D = 2 * (логарифмическая вероятность насыщенной модели минус логарифмическая вероятность подобранной модели), часто используется как мера соответствия модели в модели GLM. Объясненное отклонение в процентах, определенное как [D (нулевая модель) - D...

11
Критерий Колмогорова – Смирнова: статистика p-значения и ks-критерия уменьшается с увеличением размера выборки

Почему p-значения и статистика ks-теста уменьшаются с увеличением размера выборки? Возьмите этот код Python в качестве примера: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n)...

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Как визуализировать байесовскую доброту, пригодную для логистической регрессии

Для задачи байесовской логистической регрессии я создал апостериорное предиктивное распределение. Я выбираю из прогнозирующего распределения и получаю тысячи выборок (0,1) для каждого наблюдения, которое у меня есть. Визуализация пригодности менее интересна, например: На этом графике показаны 10...

10
Как я могу вычислить статистику теста Пирсона на отсутствие соответствия модели логистической регрессии в R?

Коэффициент отношения правдоподобия (он же отклонение) и критерий несоответствия (или качества соответствия) довольно просто получить для модели логистической регрессии (подгонка с использованием функции) в R. Однако это может быть легко подсчитать количество клеток в конечном итоге достаточно...

10
Как нарисовать подобранный график и реальный график распределения гаммы на одном графике?

Загрузите пакет, необходимый. library(ggplot2) library(MASS) Генерация 10000 номеров, приспособленных к гамма-распределению. x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] Нарисуйте функцию плотности вероятности, предположим, что мы не знаем, к какому распределению x...

10
Как оценить добротность подгонки конкретной нелинейной модели? [закрыто]

Трудно сказать, что здесь спрашивают. Этот вопрос является двусмысленным, расплывчатым, неполным, чрезмерно широким или риторическим, и на него нельзя дать разумный ответ в его нынешней форме. Чтобы получить разъяснения по этому вопросу, чтобы его можно было снова открыть, посетите справочный...

10
Есть ли у Андерсона дорогая проверка пригодности для двух наборов данных?

Я знаю, что ad.test () можно использовать для проверки нормальности. Можно ли получить ad.test для сравнения распределений из двух образцов данных? x <- rnorm(1000) y <- rgev(2000) ad.test(x,y) Как я могу выполнить тест Андерсона-Дарлинга на 2...

9
Как оценить качество пригодности для жизненных функций

Я новичок в анализе выживания, хотя у меня есть некоторые знания в области классификации и регрессии. Для регрессии мы имеем статистику MSE и R square. Но как мы можем сказать, что модель выживания A превосходит модель выживания B помимо каких-то графических графиков (кривая КМ)? Если возможно,...

9
статистический тест, чтобы увидеть, является ли связь линейной или нелинейной

У меня есть пример данных, установленных следующим образом: Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1)...

9
Совершенство в соответствии с распределением Пуассона

Каковы некоторые из хорошо известных статистических тестов для измерения достоверности соответствия наблюдаемых случайных величин распределению Пуассона? Я знаю, что тест Колмогорова-Смирнова один из таких, есть ли другие?...

9
Рассчитать кривую ROC для данных

Итак, у меня есть 16 испытаний, в которых я пытаюсь идентифицировать человека по биометрической характеристике, используя расстояние Хэмминга. Мой порог установлен на 3,5. Мои данные ниже, и только пробная версия 1 является истинным положительным результатом: Trial Hamming Distance 1 0.34 2 0.37 3...