Вопросы с тегом «r»

13

Я работаю над логистической моделью, и у меня возникают трудности с оценкой результатов. Моя модель - биномиальный логит. Мои объяснительные переменные: категориальная переменная с 15 уровнями, дихотомическая переменная и 2 непрерывные переменные. Мой N большой> 8000. Я пытаюсь смоделировать...

r logistic goodness-of-fit roc

13

Гамма GLM с логарифмической связью против гауссовой GLM с логарифмической связью против LM с логарифмическим преобразованием

Из моих результатов видно, что GLM Gamma отвечает большинству допущений, но стоит ли это значительного улучшения по сравнению с лог-преобразованным LM? Большая часть литературы, которую я нашел, посвящена пуассоновским или биномиальным GLM. Я нашел статью ОЦЕНКА ОБОБЩЕНИЙ ОБОБЩЕННОЙ ЛИНЕЙНОЙ МОДЕЛИ...

r generalized-linear-model model-selection gamma-distribution

13

Множественное вменение для пропущенных значений

Я хотел бы использовать вменение для замены отсутствующих значений в моем наборе данных при определенных ограничениях. Например, я бы хотел, чтобы вмененная переменная x1была больше или равна сумме двух других моих переменных, скажем, x2и x3. Я также хочу x3быть вмененным либо 0или, >= 14и я...

r spss missing-data multiple-imputation

13

ARIMA против ARMA на дифференцированной серии

В R (2.15.2) я однажды установил ARIMA (3,1,3) для временного ряда и один раз ARMA (3,3) для разностных временных рядов. Установленные параметры отличаются, что я приписал методу подбора в ARIMA. Кроме того, подгонка ARIMA (3,0,3) к тем же данным, что и ARMA (3,3), не приведет к идентичным...

r time-series arima fitting arma

13

Рассчитать дисперсию, объясняемую каждым предиктором в множественной регрессии, используя R

Я провел множественную регрессию, в которой модель в целом значима и объясняет около 13% дисперсии. Тем не менее, мне нужно найти величину дисперсии, объясняемой каждым значимым предиктором. Как я могу сделать это с помощью R? Вот некоторые примеры данных и кода: D = data.frame( dv = c( 0.75, 1.00,...

r regression variance

13

Как можно показать, что не существует несмещенной оценки

Предположим, что X0,X1,…,XnX0,X1,…,Xn X_{0},X_{1},\ldots,X_{n} являются случайными переменными, которые следуют за распределением Пуассона со средним λλ \lambda . Как я могу доказать, что нет объективной оценки количества 1λ1λ \dfrac{1}{\lambda}...

probability poisson-distribution unbiased-estimator estimators iid

13

Объясните шаги алгоритма LLE (локальное линейное вложение)?

Я понимаю, что основной принцип, лежащий в основе алгоритма LLE, состоит из трех этапов. Нахождение окрестности каждой точки данных по некоторой метрике, такой как k-nn. Найти веса для каждого соседа, которые обозначают влияние, которое сосед оказывает на точку данных. Построить низкоразмерное...

machine-learning model-selection feature-selection dimensionality-reduction nonlinear

13

Тест Даннетта в R, возвращающий разные значения каждый раз

Я использую библиотеку R 'multcomp' ( http://cran.r-project.org/web/packages/multcomp/ ) для вычисления теста Даннетта . Я использую скрипт ниже: Group <- factor(c("A","A","B","B","B","C","C","C","D","D","D","E","E","F","F","F")) Value <-...

r multiple-comparisons

13

Существует ли сопряженный априор для распределения Лапласа?

Существует ли сопряженный априор для распределения Лапласа ? Если нет, то есть ли известное выражение в замкнутой форме, аппроксимирующее апостериорный для параметров распределения Лапласа? Я довольно много гуглил, но безуспешно, поэтому мое текущее предположение - «нет» в ответах на вопросы выше...

bayesian conjugate-prior laplace-distribution

13

Оценка параметров LogLikelihood для линейного фильтра Калмана Гаусса

Я написал некоторый код, который может выполнять фильтрацию Калмана (используя несколько различных фильтров типа Калмана [Information Filter et al.]) Для линейного анализа пространства состояний Гаусса для n-мерного вектора состояния. Фильтры работают отлично, и я получаю хороший вывод. Тем не...

maximum-likelihood algorithms kalman-filter likelihood

13

Как проверить, отличаются ли два (ненормальных) распределения?

Я читал о t-тесте Стьюдента, но он работает, когда мы можем предположить, что исходные дистрибутивы обычно распространяются. В моем случае их точно нет. Кроме того, если у меня есть 13 дистрибутивов, нужно ли мне делать 13^2тесты?...

r hypothesis-testing distributions

13

Как масштабировать новые наблюдения для прогнозирования, когда модель снабжена масштабированными данными?

Я понимаю концепцию масштабирования матрицы данных для использования в модели линейной регрессии. Например, в R вы можете использовать: scaled.data <- scale(data, scale=TRUE) Мой единственный вопрос: для новых наблюдений, для которых я хочу предсказать выходные значения, как они правильно...

r regression prediction scales

13

Почему стандартная ошибка перехвата увеличивается с увеличением

Стандартная ошибка свободного члена ( β 0 ) в у = β 1 х + β 0 + ε задается S E ( β 0 ) 2 = σ 2 [ 1β^0β^0\hat{\beta}_0y=β1x+β0+εy=β1x+β0+εy=\beta_1x+\beta_0+\varepsilonSE(β^0)2=σ2[1n+x¯2∑ni=1(xi−x¯)2]SE(β^0)2=σ2[1n+x¯2∑i=1n(xi−x¯)2]SE(\hat{\beta}_0)^2 =...

regression interpretation standard-error

13

Пошаговое внедрение PCA в R с использованием учебника Линдси Смит

Я работаю в R с помощью превосходного учебника по PCA Линдси и Смита, и застреваю на последнем этапе. Сценарий R, приведенный ниже, выводит нас на этап (на стр.19), на котором исходные данные восстанавливаются из (в данном случае, единственного) основного компонента, который должен давать прямую...

r pca

13

Понимание создания фиктивных (ручных или автоматических) переменных в GLM

Если в формуле glm используется факторная переменная (например, пол с уровнями M и F), то создаются фиктивные переменные, которые можно найти в сводке модели glm вместе с соответствующими коэффициентами (например, полM) Если вместо того, чтобы полагаться на R для разделения коэффициента таким...

r generalized-linear-model categorical-data categorical-encoding

13

Вы наблюдаете k голов из n бросков. Честная ли монета?

Мне задали этот вопрос с в интервью. Есть ли «правильный» ответ?(n,k)=(400,220)(n,k)=(400,220)(n, k) = (400, 220) Предположим, что броски одинаковы, а вероятность голов составляет p=0.5p=0.5p=0.5 . Распределение числа голов в 400 бросках должно быть близко к нормальному (200, 10 ^ 2), так что 220...

probability hypothesis-testing self-study prior

13

Графики для иллюстрации результатов модели линейного смешанного эффекта

Я анализировал некоторые данные с использованием линейного моделирования смешанных эффектов в R. Я планирую сделать плакат с результатами, и мне было просто интересно, может ли кто-нибудь, имеющий опыт работы с моделями смешанных эффектов, предложить, какие графики использовать для иллюстрации...

r data-visualization mixed-model

13

используя информацию о соседях при вменении данных или находке вне данных (в R)

У меня есть набор данных с предположением, что ближайшие соседи являются лучшими предикторами. Просто прекрасный пример визуализации двухстороннего градиента Предположим, у нас есть случай, когда несколько значений отсутствуют, мы можем легко предсказать на основе соседей и тренда. Соответствующая...

r prediction outliers data-imputation multiple-imputation

13

Как интерпретировать автокорреляцию

Я рассчитал автокорреляцию по данным временного ряда о характере движения рыбы по ее положениям: X ( x.ts) и Y ( y.ts). Используя R, я запустил следующие функции и создал следующие графики: acf(x.ts,100) acf(y.ts,100) Мой вопрос, как мне интерпретировать эти сюжеты? Какая информация необходима,...

r time-series autocorrelation

13

Есть ли причина не использовать ортогональные многочлены при подборе регрессий?

В общем, мне интересно, если там когда-либо лучше не использовать ортогональные полиномы при подборе регрессии с переменными более высокого порядка. В частности, мне интересно с использованием R: Если poly()с raw = FALSEпроизводит то же значение, что и подогнанного poly()с raw = TRUE, и polyс raw =...

r regression polynomial