Вопросы с тегом «r»

9
Доверительные и прогнозные интервалы линейной регрессионной модели

Итак, я пытаюсь понять линейную регрессию. У меня есть набор данных, и все выглядит хорошо, но я в замешательстве. Это моя линейная модель-сводка: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.2068621 0.0247002 8.375 4.13e-09 *** temp 0.0031074 0.0004779 6.502 4.79e-07 *** ---...

9
Сравнение показателей заболеваемости

Я хочу сравнить показатели заболеваемости между двумя группами (одна без болезни и одна с). Я планировал рассчитать коэффициент заболеваемости (IRR), то есть группу заболеваемости B / группу заболеваемости A, а затем проверить, равен ли этот показатель 1, и, наконец, рассчитать 95% интервалы CI для...

9
Вычисление проблем, интерпретация regsubsets и общие вопросы о процедуре выбора модели

Я хочу выбрать модели, используя regsubsets(). У меня есть фрейм данных с именем olympiadaten (загруженные данные: http://www.sendspace.com/file/8e27d0 ). Я сначала присоединяю этот фрейм данных, а затем начинаю анализировать, мой код: attach(olympiadaten) library(leaps) a<-regsubsets(Gesamt ~...

9
Определение крупнейшего участника в группе

Я не знаю много о статистике, так что терпите меня. Допустим, у меня есть набор из 1000 рабочих. Я хочу выяснить, кто самый трудный работник, но я могу измерить только объем работы, выполняемой группами по 1-100 человек за час работы. Предполагая, что каждый работник всегда выполняет примерно...

9
Как построить 20 лет ежедневных данных во временных рядах

У меня есть следующий набор данных: https://dl.dropbox.com/u/22681355/ORACLE.csv и я хотел бы отобразить ежедневные изменения в «Open» по «Date», поэтому я сделал следующее: oracle <- read.csv(file="http://dl.dropbox.com/u/22681355/ORACLE.csv", header=TRUE) plot(oracle$Date, oracle$Open,...

9
Коробка Кокса Преобразования для регрессии

Я пытаюсь согласовать линейную модель с некоторыми данными только одним предиктором (скажем, (x, y)). Данные таковы, что для малых значений x значения y обеспечивают плотное прилегание к прямой линии, однако при увеличении значений x значения y становятся более изменчивыми. Вот пример таких данных...

9
Интервал цензурированной модели пропорциональных рисков Кокса в R

С учетом цензурированного интервала времени выживания, как я могу выполнить интервальную цензуру модели Кокса PH в R? Поиск в rseek обнаруживает пакет intcox, которого больше нет в Rхранилище. Я почти уверен, что coxphфункция в survivalпакете не может обрабатывать данные выживания с интервалом...

9
Путаница, связанная с линейными динамическими системами

Я читал эту книгу епископом «Распознавание образов и машинное обучение». У меня была путаница, связанная с выводом линейной динамической системы. В LDS мы предполагаем, что скрытые переменные непрерывны. Если Z обозначает скрытые переменные, а X обозначает наблюдаемые переменные p ( zN| Zn - 1) =...

9
«Забывчивость» настоятеля в байесовской обстановке?

Хорошо известно, что по мере того, как у вас появляется больше доказательств (скажем, в виде большего для iid примеров), байесовский априор «забывается», и на большинство выводов влияют доказательства (или вероятность).нNNnNNn Это легко увидеть для различных конкретных случаев (например, Бернулли с...

9
Расчет неизвестного p-значения

Недавно я отлаживал R-скрипт и обнаружил что-то очень странное, автор определил их собственную функцию p-значения pval <- function(x, y){ if (x+y<20) { # x + y is small, requires R.basic p1<- nChooseK(x+y,x) * 2^-(x+y+1); p2<- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else {...

9
Расчет Jaccard или другого коэффициента ассоциации для двоичных данных с использованием умножения матриц

Я хочу знать, есть ли какой-нибудь возможный способ для вычисления коэффициента Жакара с использованием умножения матриц. Я использовал этот код jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x)))...

9
Моделирование данных для логистической регрессии с категориальной переменной

Я пытался создать некоторые тестовые данные для логистической регрессии, и я нашел этот пост Как имитировать искусственные данные для логистической регрессии? Это хороший ответ, но он создает только непрерывные переменные. Как насчет категориальной переменной x3 с 5 уровнями (ABCDE), связанной с y...

9
Выбор кластеров для k-средних: случай 1 кластера

Кто-нибудь знает хороший метод, чтобы определить, подходит ли даже кластеризация с использованием kmeans? То есть, что если ваш образец на самом деле является однородным? Я знаю, что нечто вроде смешанной модели (через mclust в R) предоставит статистику соответствия для случая кластера 1: k, но,...

9
Как указать контрастную матрицу (в R) для разницы между одним уровнем и средним по другим?

У меня есть модель регрессии, которая выглядит следующим образом:Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y = \beta_0+\beta_1X_1 + \beta_2X_2 + \beta_3X_3 +\beta_{12}X_1X_2+\beta_{13}X_1X_3+\beta_{123}X_1X_2X_3 ... или в обозначении R: y ~ x1 + x2...

9
Стэн делает прогностические постеры?

Есть ли в stan (в частности, rstan) встроенные средства для генерации прогнозирующих апостериорных распределений? Нетрудно сгенерировать распределение из соответствия stan, но я бы не стал изобретать...

9
EFA однозначно поддерживает однофакторное измерение, внутренне непротиворечивое, но CFA плохо подходит?

Я исследую психометрические свойства меры самоотчета из 10 пунктов. У меня около 400 дел в двух независимых выборках. Элементы выполнены по 4-балльной шкале Лайкерта. EFA явно поддерживает однофакторное решение (например, первое собственное значение больше 6, все остальные меньше 1), и альфа...

9
Прогноз ARIMA с сезонностью и трендом, странный результат

Поскольку я перехожу к прогнозированию с использованием моделей ARIMA, я пытаюсь понять, как можно улучшить прогноз на основе соответствия ARIMA сезонности и отклонениям. Мои данные представляют собой следующие временные ряды (более 3 лет, с явной тенденцией к росту и видимой сезонностью, которая,...

9
Значение p-значения переменных модели логистической регрессии

Итак, я работаю с моделями логистической регрессии в R. Хотя я все еще новичок в статистике, я чувствую, что уже получил некоторое понимание моделей регрессии, но есть еще кое-что, что меня беспокоит: Глядя на связанный рисунок, вы видите итоговую R-печать для примера модели, которую я создал....

9
как интерпретировать член взаимодействия в формуле lm в R?

В R, если я вызываю lm()функцию следующим образом: lm.1 = lm(response ~ var1 + var2 + var1 * var2) summary(lm.1) Это дает мне линейную модель переменной отклика с var1, var2и взаимодействие между ними. Однако как именно мы численно интерпретируем термин взаимодействия? Документация говорит, что это...