Вопросы с тегом «goodness-of-fit»

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

19
Хорошая посадка и какую модель выбрать линейную регрессию или Пуассона

Мне нужны некоторые советы относительно двух основных дилемм в моем исследовании, которое представляет собой исследование трех крупных фармацевтических препаратов и инноваций. Количество патентов в год является зависимой переменной. Мои вопросы Каковы наиболее важные критерии для хорошей модели?...

19
Хорошо подходит для 2D гистограмм

У меня есть два набора данных, представляющих параметры звезд: наблюдаемый и смоделированный. С помощью этих наборов я создаю так называемую двухцветную диаграмму (TCD). Образец можно увидеть здесь: Быть наблюдаемые данные и Аргументы B данных , извлеченные из модели (не говоря уже о черных линиях,...

19
Является ли взвешенный

Я оценил надежную линейную модель Rс весами ММ, используя rlm()пакет MASS. `R`` не предоставляет значение для модели, но я хотел бы иметь его, если это значимое количество. Мне также интересно знать, есть ли смысл иметь значение которое взвешивает общую и остаточную дисперсию так же, как...

18
Влияние границ бина на основе данных на критерий пригодности хи-квадрат?

Оставляя в стороне очевидную проблему малой мощности хи-квадрата в подобных обстоятельствах, представьте себе, что вы проводите проверку качества хи-квадрата для некоторой плотности с неопределенными параметрами путем объединения данных. Для конкретности, скажем, экспоненциальное распределение с...

17
Что означает отрицательный R-квадрат?

Допустим, у меня есть некоторые данные, а затем я подгоняю данные с помощью модели (нелинейная регрессия). Затем я вычисляю R-квадрат ( р2р2R^2 ). Когда R-квадрат отрицательный, что это значит? Значит ли это, что моя модель плохая? Я знаю, что диапазон р2р2R^2 может быть [-1,1]. Когда р2р2R^2 равен...

17
Какая связь между

Мне было интересно, есть ли связь между и F-Test.R2R2R^2 Обычно и измеряет силу линейные отношения в регрессии.R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} F-тест просто подтверждает гипотезу. Есть ли связь...

16
Остатки Пирсона

Вопрос новичка об остатке Пирсона в контексте теста хи-квадрат на соответствие формы: Помимо статистики теста, chisq.testфункция R сообщает об остатке Пирсона: (obs - exp) / sqrt(exp) Я понимаю, почему смотреть на необработанную разницу между наблюдаемыми и ожидаемыми значениями не так...

16
Апостериорный тест для критерия пригодности хи-квадрат

Я провожу тест на соответствие критерию хи-квадрат (GOF) с тремя категориями и специально хочу проверить нулевое, что пропорции населения в каждой категории равны (то есть пропорция составляет 1/3 в каждой группе):                 НАБЛЮДЕННЫЕ ДАННЫЕ Группа 1     Группа 2     Группа 3     Всего...

16
Проверка предположений ANOVA

Несколько месяцев назад я опубликовал вопрос о тестах гомоскедастичности в R на SO, и Ян Феллоуз ответил на это (я перефразирую его ответ очень свободно): Тесты на гомоскедастичность не являются хорошим инструментом при проверке соответствия вашей модели. С небольшими выборками у вас недостаточно...

15
Имеет ли смысл проводить односторонний тест Колмогорова-Смирнова?

Имеет ли смысл и возможно ли выполнить односторонний тест KS? Какой будет нулевая гипотеза такого теста? Или тест KS по своей сути является двусторонним тестом? Мне был бы полезен ответ, который помог мне понять распределение D (я работаю через статью Масси 1951 года и нахожу описание сложным,...

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

13
Как проверить, следует ли распределение степенному закону?

У меня есть данные о том, сколько пользователей публикуют сколько вопросов. Например, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Это означает, что 2 пользователя разместили по 100 вопросов, 9 пользователей - по 10 вопросов и т. Д. Итак, как я могу определить, UserCount,...

13
Оценка моделей логистической регрессии

Этот вопрос возникает из-за моей путаницы в том, как решить, достаточно ли хороша логистическая модель. У меня есть модели, которые используют состояние пар индивидуальный проект через два года после их формирования в качестве зависимой переменной. Результат успешен (1) или нет (0). У меня есть...

13
Оценка модели логистической регрессии

Я работаю над логистической моделью, и у меня возникают трудности с оценкой результатов. Моя модель - биномиальный логит. Мои объяснительные переменные: категориальная переменная с 15 уровнями, дихотомическая переменная и 2 непрерывные переменные. Мой N большой> 8000. Я пытаюсь смоделировать...

13
LARS против координатного спуска для лассо

Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи...

13
Как доказать, что рейтинг Эло или рейтинг страницы имеют значение для моего набора?

У меня есть набор игроков. Они играют друг против друга (попарно). Пары игроков выбираются случайным образом. В любой игре один игрок выигрывает, а другой проигрывает. Игроки играют друг с другом ограниченное количество игр (некоторые игроки играют больше игр, некоторые меньше). Итак, у меня есть...

13
Как проверить, соответствует ли выборка данных гамма-распределению?

У меня есть выборка данных, которые были сгенерированы из непрерывной случайной величины X. И из гистограммы, которую я рисую с использованием R, я предполагаю, что, возможно, распределение X подчиняется определенному гамма-распределению. Но я не знаю точных параметров этого гамма-распределения....

12
Насколько хороша моя модель, основанная на значении диагностической метрики (

Я установил свою модель и пытаюсь понять, хороша ли она. Я рассчитал рекомендуемые показатели для его оценки ( / AUC / точность / ошибка прогнозирования / и т. Д.), Но не знаю, как их интерпретировать. Короче говоря, как мне определить, хороша ли моя модель по метрике? Достаточно ли 0,6 (например),...

12
Логистическая регрессия со сплайнами регрессии в R

Я разрабатывал модель логистической регрессии на основе ретроспективных данных из национальной базы данных о травмах головы в Великобритании. Ключевым результатом является 30-дневная смертность (обозначается как «выживаемая» мера). Другие меры с опубликованным доказательством существенного влияния...