Вопросы с тегом «r»

15
Как подобрать смешанную модель с переменной отклика от 0 до 1?

Я пытаюсь использовать lme4::glmer()для подгонки биномиальной обобщенной смешанной модели (GLMM) с зависимой переменной, которая является не двоичной, а непрерывной переменной от нуля до единицы. Можно думать об этой переменной как о вероятности; на самом деле это вероятность того, как сообщили...

15
Беспристрастная оценка отношения двух коэффициентов регрессии?

Предположим, вы подходите к линейной / логистической регрессии с целью объективной оценки . Вы очень уверены, что и очень положительны по отношению к шуму в своих оценках.g(y)=a0+a1⋅x1+a2⋅x2g(y)=a0+a1⋅x1+a2⋅x2g(y) = a_0 + a_1\cdot x_1 + a_2\cdot x_2a1a2a1a2\frac{a_1}{a_2}a1a1a_1a2a2a_2 Если у вас...

15
Что такое «базовый уровень» в кривой точного отзыва

Я пытаюсь понять точную кривую отзыва, я понимаю, что такое точность и отзыв, но не понимаю, что такое базовое значение. Я читал эту ссылку https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ и я не понимаю часть базовой линии, как показано в «Кривая точного...

15
Зачем вам нужно масштабировать данные в KNN

Может кто-нибудь объяснить мне, почему вам нужно нормализовать данные при использовании K ближайших соседей. Я пытался найти это, но я все еще не могу понять это. Я нашел следующую ссылку: https://discuss.analyticsvidhya.com/t/why-it-is-necessary-to-normalize-in-knn/2715 Но в этом объяснении я не...

15
Сравнение Ньюи-Уэста (1987) и Хансена-Ходрика (1980)

Вопрос: Каковы основные различия и сходства между использованием стандартных ошибок Newey-West (1987) и Hansen-Hodrick (1980)? В каких ситуациях одна из них должна быть предпочтительнее другой? Примечания: Я знаю, как работает каждая из этих процедур настройки; однако я еще не нашел ни одного...

15
Использование glm () вместо простого теста хи-квадрат

Я заинтересован в изменении нулевых гипотез, используя glm()в R. Например: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) проверяет гипотезу, что . Что если я захочу изменить значение null на = какое-то произвольное значение внутри ? рр = 0,5пзнак равно0,5p = 0.5ппpglm() Я знаю,...

15
Минимизация смещения в объяснительном моделировании, почему? (Галита Шмуэли «Объяснять или предсказывать»)

Этот вопрос ссылается на статью Галита Шмуэли «Объяснить или предсказать» . В частности, в разделе 1.5 «Объяснения и предсказания различны» профессор Шмуэли пишет: При объяснительном моделировании основное внимание уделяется минимизации смещения для получения наиболее точного представления основной...

15
Расчет доверительных интервалов для логистической регрессии

Я использую биномиальную логистическую регрессию , чтобы определить , если воздействие has_xили has_yвоздействий на вероятность того , что пользователь нажмет на что - то. Моя модель следующая: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) Это вывод из моей модели:...

15
Почему предположение о нормальности в линейной регрессии

Мой вопрос очень прост: почему мы выбираем нормальное в качестве распределения, которому следует термин ошибки в предположении о линейной регрессии? Почему мы не выбираем других, как униформу, т или...

14
Вопросы о расхождении KL?

Я сравниваю два распределения с дивергенцией KL, которая возвращает мне нестандартизированное число, которое, согласно тому, что я читал об этой мере, представляет собой объем информации, необходимый для преобразования одной гипотезы в другую. У меня есть два вопроса: а) Есть ли способ...

14
Что будет означать доверительный интервал вокруг прогнозируемого значения из модели смешанных эффектов?

Я смотрел на эту страницуи заметил методы для доверительных интервалов для lme и lmer в R. Для тех, кто не знает R, это функции для генерации смешанных эффектов или многоуровневых моделей. Если бы у меня были фиксированные эффекты в чем-то вроде схемы повторных измерений, что бы означал...

14
Как определить размер выборки, необходимый для повторного измерения ANOVA?

Мне нужна помощь по повторному измерению ANOVA. Мы изучаем влияние некоторых вмешательств на снижение частоты инфицирования кровотоком (BSI) в некоторых отделениях. Мы планируем собирать информацию о скорости BSI ежемесячно, сначала 12 месяцев без вмешательства, а затем 12 месяцев с вмешательством....

14
Последующие действия: На смешанном графике ANOVA предполагаемые SE или фактические SE?

В настоящее время я заканчиваю работу и со вчерашнего дня наткнулся на этот вопрос, который заставил меня задать тот же вопрос самому себе. Лучше ли предоставить моему графику фактическую стандартную ошибку из данных или оценку, рассчитанную по моей ANOVA? Поскольку вчерашний вопрос был довольно...

14
Пакет R для логистической регрессии с фиксированным эффектом

Я ищу Rпакет для оценки коэффициентов логит-моделей с индивидуальным фиксированным эффектом (индивидуальный перехват) с использованием оценки Чемберлена 1980 года. Это часто называют оценкой логита Чемберлена с фиксированным эффектом. Это классическая оценка при работе с бинарными данными панели...

14
Почему оценка ошибки случайного леса OOB улучшается при уменьшении количества выбранных объектов?

Я применяю алгоритм случайного леса в качестве классификатора для набора данных микрочипов, который разделен на две известные группы с тысячами объектов. После первого запуска я смотрю на важность функций и снова запускаю алгоритм дерева с 5, 10 и 20 наиболее важными функциями. Я обнаружил, что для...

14
МЕНЬШЕ, что позволяет разрывы

Существует ли метод моделирования, такой как LOESS, который допускает ноль, один или несколько разрывов, где время разрывов не известно априори? Если метод существует, есть ли существующая реализация в R?...

14
Как сделать возрастную пирамиду похожей на сюжет в R?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Возрастная пирамида выглядит следующим образом: я хотел бы сделать что-то похожее, а именно 2 барплота (не гистограммы)...

14
Управление ошибками с помощью GPS-маршрутов (теоретическая основа?)

Я ищу подходящую теоретическую базу или специальность, чтобы помочь мне разобраться, как справляться с ошибками, которые имеет система GPS - особенно при работе с маршрутами. По сути, я ищу требования к данным и любые алгоритмы, чтобы использовать, чтобы иметь возможность установить длину следа....

14
OLS СИНИЙ. Но что, если мне наплевать на объективность и линейность?

Теорема Гаусса-Маркова говорит нам, что оценка OLS является наилучшей линейной несмещенной оценкой для модели линейной регрессии. Но предположим, что меня не волнует линейность и непредвзятость. Тогда есть ли какая-либо другая (возможно, нелинейная / смещенная) оценка для модели линейной регрессии,...

14
Вычисление корреляции (и значимости указанной корреляции) между парой временных рядов

У меня есть два временных ряда S и T. Они имеют одинаковую частоту и одинаковую длину. Я хотел бы рассчитать (используя R) корреляцию между этой парой (т.е. S и T), а также иметь возможность рассчитать значимость корреляции), чтобы я мог определить, является ли корреляция случайной или нет. Я хотел...