Вопросы с тегом «r»

13
Оценка модели логистической регрессии

Я работаю над логистической моделью, и у меня возникают трудности с оценкой результатов. Моя модель - биномиальный логит. Мои объяснительные переменные: категориальная переменная с 15 уровнями, дихотомическая переменная и 2 непрерывные переменные. Мой N большой> 8000. Я пытаюсь смоделировать...

13
Гамма GLM с логарифмической связью против гауссовой GLM с логарифмической связью против LM с логарифмическим преобразованием

Из моих результатов видно, что GLM Gamma отвечает большинству допущений, но стоит ли это значительного улучшения по сравнению с лог-преобразованным LM? Большая часть литературы, которую я нашел, посвящена пуассоновским или биномиальным GLM. Я нашел статью ОЦЕНКА ОБОБЩЕНИЙ ОБОБЩЕННОЙ ЛИНЕЙНОЙ МОДЕЛИ...

13
Множественное вменение для пропущенных значений

Я хотел бы использовать вменение для замены отсутствующих значений в моем наборе данных при определенных ограничениях. Например, я бы хотел, чтобы вмененная переменная x1была больше или равна сумме двух других моих переменных, скажем, x2и x3. Я также хочу x3быть вмененным либо 0или, >= 14и я...

13
ARIMA против ARMA на дифференцированной серии

В R (2.15.2) я однажды установил ARIMA (3,1,3) для временного ряда и один раз ARMA (3,3) для разностных временных рядов. Установленные параметры отличаются, что я приписал методу подбора в ARIMA. Кроме того, подгонка ARIMA (3,0,3) к тем же данным, что и ARMA (3,3), не приведет к идентичным...

13
Рассчитать дисперсию, объясняемую каждым предиктором в множественной регрессии, используя R

Я провел множественную регрессию, в которой модель в целом значима и объясняет около 13% дисперсии. Тем не менее, мне нужно найти величину дисперсии, объясняемой каждым значимым предиктором. Как я могу сделать это с помощью R? Вот некоторые примеры данных и кода: D = data.frame( dv = c( 0.75, 1.00,...

13
Как можно показать, что не существует несмещенной оценки

Предположим, что X0,X1,…,XnX0,X1,…,Xn X_{0},X_{1},\ldots,X_{n} являются случайными переменными, которые следуют за распределением Пуассона со средним λλ \lambda . Как я могу доказать, что нет объективной оценки количества 1λ1λ \dfrac{1}{\lambda}...

13
Объясните шаги алгоритма LLE (локальное линейное вложение)?

Я понимаю, что основной принцип, лежащий в основе алгоритма LLE, состоит из трех этапов. Нахождение окрестности каждой точки данных по некоторой метрике, такой как k-nn. Найти веса для каждого соседа, которые обозначают влияние, которое сосед оказывает на точку данных. Построить низкоразмерное...

13
Существует ли сопряженный априор для распределения Лапласа?

Существует ли сопряженный априор для распределения Лапласа ? Если нет, то есть ли известное выражение в замкнутой форме, аппроксимирующее апостериорный для параметров распределения Лапласа? Я довольно много гуглил, но безуспешно, поэтому мое текущее предположение - «нет» в ответах на вопросы выше...

13
Оценка параметров LogLikelihood для линейного фильтра Калмана Гаусса

Я написал некоторый код, который может выполнять фильтрацию Калмана (используя несколько различных фильтров типа Калмана [Information Filter et al.]) Для линейного анализа пространства состояний Гаусса для n-мерного вектора состояния. Фильтры работают отлично, и я получаю хороший вывод. Тем не...

13
Как проверить, отличаются ли два (ненормальных) распределения?

Я читал о t-тесте Стьюдента, но он работает, когда мы можем предположить, что исходные дистрибутивы обычно распространяются. В моем случае их точно нет. Кроме того, если у меня есть 13 дистрибутивов, нужно ли мне делать 13^2тесты?...

13
Как масштабировать новые наблюдения для прогнозирования, когда модель снабжена масштабированными данными?

Я понимаю концепцию масштабирования матрицы данных для использования в модели линейной регрессии. Например, в R вы можете использовать: scaled.data <- scale(data, scale=TRUE) Мой единственный вопрос: для новых наблюдений, для которых я хочу предсказать выходные значения, как они правильно...

13
Пошаговое внедрение PCA в R с использованием учебника Линдси Смит

Я работаю в R с помощью превосходного учебника по PCA Линдси и Смита, и застреваю на последнем этапе. Сценарий R, приведенный ниже, выводит нас на этап (на стр.19), на котором исходные данные восстанавливаются из (в данном случае, единственного) основного компонента, который должен давать прямую...

13
Понимание создания фиктивных (ручных или автоматических) переменных в GLM

Если в формуле glm используется факторная переменная (например, пол с уровнями M и F), то создаются фиктивные переменные, которые можно найти в сводке модели glm вместе с соответствующими коэффициентами (например, полM) Если вместо того, чтобы полагаться на R для разделения коэффициента таким...

13
Вы наблюдаете k голов из n бросков. Честная ли монета?

Мне задали этот вопрос с в интервью. Есть ли «правильный» ответ?(n,k)=(400,220)(n,k)=(400,220)(n, k) = (400, 220) Предположим, что броски одинаковы, а вероятность голов составляет p=0.5p=0.5p=0.5 . Распределение числа голов в 400 бросках должно быть близко к нормальному (200, 10 ^ 2), так что 220...

13
Графики для иллюстрации результатов модели линейного смешанного эффекта

Я анализировал некоторые данные с использованием линейного моделирования смешанных эффектов в R. Я планирую сделать плакат с результатами, и мне было просто интересно, может ли кто-нибудь, имеющий опыт работы с моделями смешанных эффектов, предложить, какие графики использовать для иллюстрации...

13
используя информацию о соседях при вменении данных или находке вне данных (в R)

У меня есть набор данных с предположением, что ближайшие соседи являются лучшими предикторами. Просто прекрасный пример визуализации двухстороннего градиента Предположим, у нас есть случай, когда несколько значений отсутствуют, мы можем легко предсказать на основе соседей и тренда. Соответствующая...

13
Как интерпретировать автокорреляцию

Я рассчитал автокорреляцию по данным временного ряда о характере движения рыбы по ее положениям: X ( x.ts) и Y ( y.ts). Используя R, я запустил следующие функции и создал следующие графики: acf(x.ts,100) acf(y.ts,100) Мой вопрос, как мне интерпретировать эти сюжеты? Какая информация необходима,...

13
Есть ли причина не использовать ортогональные многочлены при подборе регрессий?

В общем, мне интересно, если там когда-либо лучше не использовать ортогональные полиномы при подборе регрессии с переменными более высокого порядка. В частности, мне интересно с использованием R: Если poly()с raw = FALSEпроизводит то же значение, что и подогнанного poly()с raw = TRUE, и polyс raw =...