Вопросы с тегом «r»

12

Нахождение подогнанных и прогнозируемых значений для статистической модели

Допустим, у меня есть следующие данные и я использую модель регрессии: df=data.frame(income=c(5,3,47,8,6,5), won=c(0,0,1,1,1,0), age=c(18,18,23,50,19,39), home=c(0,0,1,0,0,1)) С одной стороны, я использую линейную модель для прогнозирования доходов: md1 = lm(income ~ age + home + home, data=df)...

r

12

randomForest выбирает регрессию вместо классификации

Я использую пакет randomForest в R и использую данные радужной оболочки, генерируемый случайный лес является классификацией, но когда я использую набор данных с примерно 700 объектами (каждый объект представлен в пикселе размером 28x28 пикселей), а столбец метки называется label, то...

r random-forest

12

Почему собственные и svd-разложения ковариационной матрицы на основе разреженных данных дают разные результаты?

Я пытаюсь разложить ковариационную матрицу на основе набора данных разреженных / gappy. Я замечаю, что сумма лямбда (объясненная дисперсия), рассчитанная с помощью svd, усиливается с помощью все более и более дурацких данных. Без пробелов, да svdи eigenте же результаты. Это, кажется, не происходит...

r svd eigenvalues

12

STL на временных рядах с пропущенными значениями для обнаружения аномалий

Я пытаюсь обнаружить аномальные значения во временном ряду климатических данных с некоторыми отсутствующими наблюдениями. При поиске в Интернете я нашел много доступных подходов. Из них stl разложение кажется привлекательным в смысле удаления трендовых и сезонных компонентов и изучения остатка....

r time-series outliers missing-data

12

Линейная регрессия с повторными измерениями в R

Я не смог понять, как выполнить линейную регрессию в R для повторного измерения проекта. В предыдущем вопросе (все еще без ответа) мне было предложено не использовать, lmа использовать смешанные модели. Я использовал lmследующим образом: lm.velocity_vs_Velocity_response <-...

r regression mixed-model repeated-measures

12

Как читать добро подходят по NLS R?

Я пытаюсь интерпретировать вывод nls (). Я прочитал этот пост, но я все еще не понимаю, как выбрать наиболее подходящий. Из моих припадок у меня есть два выхода: > summary(m) Formula: y ~ I(a * x^b) Parameters: Estimate Std. Error t value Pr(>|t|) a 479.92903 62.96371 7.622 0.000618 *** b...

r least-squares nonlinear-regression goodness-of-fit

12

Случайный лес: что если я знаю, что переменная важна

Насколько я понимаю, случайный лес выбирает случайным образом переменные mtry для построения каждого дерева решений. Таким образом, если mtry = ncol / 3, то каждая переменная будет использоваться в среднем на 1/3 деревьев. И 2/3 деревьев не будут их использовать. Но что, если я знаю, что одна...

r random-forest parameterization

12

Десезонные данные подсчета

Я использовал stl () в R, чтобы разложить данные счетчиков на трендовые, сезонные и нерегулярные компоненты. Результирующие значения тренда больше не являются целыми числами. У меня есть следующие вопросы: Является ли stl () подходящим способом для десезонализации данных подсчета? Поскольку...

r time-series poisson-distribution

12

Прогнозирование заказанного логита в R

Я пытаюсь сделать упорядоченную регрессию логита. Я управляю моделью вот так (просто глупая маленькая модель, оценивающая количество фирм на рынке по показателям дохода и населения). Мой вопрос о прогнозах. nfirm.opr<-polr(y~pop0+inc0, Hess = TRUE) pr_out<-predict(nfirm.opr) Когда я запускаю...

r econometrics logit ordered-logit

12

Как рассчитать «Пути к Белому дому», используя R?

Я только что наткнулся на этот замечательный анализ, который одновременно интересен и красив: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html Мне интересно, как такое «дерево путей» может быть построено с использованием R. Какие данные и алгоритм нужны для...

r data-visualization politics

12

Логарифмические линейные модели

Может кто-нибудь объяснить, почему мы используем Log Linear Models в очень непрофессиональных терминах? Я из инженерного образования, и это действительно сложная тема для меня, статистика. Буду благодарен за...

modeling log-linear

12

Kernelised k Ближайший сосед

Я новичок в ядрах и попал в ловушку при попытке ядра KNN. прелиминарии Я использую ядро с полиномами: K(x,y)=(1+⟨x,y⟩)dK(x,y)=(1+⟨x,y⟩)dK(\mathbf{x},\mathbf{y}) = (1 + \langle \mathbf{x},\mathbf{y} \rangle)^d Ваш типичный евклидов kNN использует следующую метрику расстояния:...

machine-learning kernel-trick k-nearest-neighbour

12

Количество значащих цифр для отчета

Существует ли более научный способ определения количества значащих цифр, сообщаемых для среднего значения или доверительного интервала в ситуации, которая является довольно стандартной - например, первый год обучения в колледже. Я видел количество значащих цифр в таблице : почему мы не используем...

standard-deviation error reporting communication

12

Интерпретация результата кластеризации k-средних в R

Я использовал kmeansинструкцию R для выполнения алгоритма k-средних в наборе данных радужной оболочки глаза Андерсона. У меня есть вопрос о некоторых параметрах, которые я получил. Результаты: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 В...

r machine-learning clustering interpretation k-means

12

Прогнозирование данных счета со случайным лесом

Можно ли обучить Случайный Лес для правильного прогнозирования данных счета? Как это будет продолжаться? У меня довольно широкий диапазон значений, поэтому классификация не имеет смысла. Если бы я использовал регрессию, я бы просто усек результат? Я совершенно потерян здесь. Есть...

r regression random-forest prediction count-data

12

Стратегия подгонки сильно нелинейной функции

Для анализа данных из биофизического эксперимента в настоящее время я пытаюсь выполнить подгонку кривой с помощью высоко нелинейной модели. Функция модели выглядит в основном так: Y= а х + б х- 1 / 2y=ax+bx−1/2y = ax + bx^{-1/2} Здесь, особенно значение представляет большой интерес.бbb Сюжет для...

curve-fitting nonlinear

12

Разница в сообщаемых значениях p между lm и aov в R

Чем объясняются различия в p-значениях в следующих aovи lmвызовах? Разница только из-за различных типов вычислений сумм квадратов? set.seed(10) data=rnorm(12) f1=rep(c(1,2),6) f2=c(rep(1,6),rep(2,6)) summary(aov(data~f1*f2)) summary(lm(data~f1*f2))$coeff...

r regression anova linear-model sums-of-squares

12

Пакеты выбора функций в R, которые выполняют регрессию и классификацию

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я очень плохо знаком с R. Я сейчас учусь машинному обучению. Очень жаль, если этот вопрос кажется очень простым. Я...

r feature-selection

12

Как проверить избыточную дисперсию в пуассоновском GLMM с помощью lmer () в R?

У меня есть следующая модель: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... и это сводный результат. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare +...

r poisson-distribution lme4-nlme glmm overdispersion

12

Первые шаги в обучении для прогнозирования финансовых временных рядов с использованием машинного обучения

Я пытаюсь понять, как использовать машинное обучение для прогнозирования финансовых временных рядов на 1 или более шагов в будущее. У меня есть финансовые временные ряды с некоторыми описательными данными, и я хотел бы сформировать модель и затем использовать модель для прогнозирования n шагов...

r time-series machine-learning random-forest finance