Вопросы с тегом «r»

12
Нахождение подогнанных и прогнозируемых значений для статистической модели

Допустим, у меня есть следующие данные и я использую модель регрессии: df=data.frame(income=c(5,3,47,8,6,5), won=c(0,0,1,1,1,0), age=c(18,18,23,50,19,39), home=c(0,0,1,0,0,1)) С одной стороны, я использую линейную модель для прогнозирования доходов: md1 = lm(income ~ age + home + home, data=df)...

12
randomForest выбирает регрессию вместо классификации

Я использую пакет randomForest в R и использую данные радужной оболочки, генерируемый случайный лес является классификацией, но когда я использую набор данных с примерно 700 объектами (каждый объект представлен в пикселе размером 28x28 пикселей), а столбец метки называется label, то...

12
Почему собственные и svd-разложения ковариационной матрицы на основе разреженных данных дают разные результаты?

Я пытаюсь разложить ковариационную матрицу на основе набора данных разреженных / gappy. Я замечаю, что сумма лямбда (объясненная дисперсия), рассчитанная с помощью svd, усиливается с помощью все более и более дурацких данных. Без пробелов, да svdи eigenте же результаты. Это, кажется, не происходит...

12
STL на временных рядах с пропущенными значениями для обнаружения аномалий

Я пытаюсь обнаружить аномальные значения во временном ряду климатических данных с некоторыми отсутствующими наблюдениями. При поиске в Интернете я нашел много доступных подходов. Из них stl разложение кажется привлекательным в смысле удаления трендовых и сезонных компонентов и изучения остатка....

12
Линейная регрессия с повторными измерениями в R

Я не смог понять, как выполнить линейную регрессию в R для повторного измерения проекта. В предыдущем вопросе (все еще без ответа) мне было предложено не использовать, lmа использовать смешанные модели. Я использовал lmследующим образом: lm.velocity_vs_Velocity_response <-...

12
Как читать добро подходят по NLS R?

Я пытаюсь интерпретировать вывод nls (). Я прочитал этот пост, но я все еще не понимаю, как выбрать наиболее подходящий. Из моих припадок у меня есть два выхода: > summary(m) Formula: y ~ I(a * x^b) Parameters: Estimate Std. Error t value Pr(>|t|) a 479.92903 62.96371 7.622 0.000618 *** b...

12
Случайный лес: что если я знаю, что переменная важна

Насколько я понимаю, случайный лес выбирает случайным образом переменные mtry для построения каждого дерева решений. Таким образом, если mtry = ncol / 3, то каждая переменная будет использоваться в среднем на 1/3 деревьев. И 2/3 деревьев не будут их использовать. Но что, если я знаю, что одна...

12
Десезонные данные подсчета

Я использовал stl () в R, чтобы разложить данные счетчиков на трендовые, сезонные и нерегулярные компоненты. Результирующие значения тренда больше не являются целыми числами. У меня есть следующие вопросы: Является ли stl () подходящим способом для десезонализации данных подсчета? Поскольку...

12
Прогнозирование заказанного логита в R

Я пытаюсь сделать упорядоченную регрессию логита. Я управляю моделью вот так (просто глупая маленькая модель, оценивающая количество фирм на рынке по показателям дохода и населения). Мой вопрос о прогнозах. nfirm.opr<-polr(y~pop0+inc0, Hess = TRUE) pr_out<-predict(nfirm.opr) Когда я запускаю...

12
Как рассчитать «Пути к Белому дому», используя R?

Я только что наткнулся на этот замечательный анализ, который одновременно интересен и красив: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html Мне интересно, как такое «дерево путей» может быть построено с использованием R. Какие данные и алгоритм нужны для...

12
Логарифмические линейные модели

Может кто-нибудь объяснить, почему мы используем Log Linear Models в очень непрофессиональных терминах? Я из инженерного образования, и это действительно сложная тема для меня, статистика. Буду благодарен за...

12
Kernelised k Ближайший сосед

Я новичок в ядрах и попал в ловушку при попытке ядра KNN. прелиминарии Я использую ядро ​​с полиномами: K(x,y)=(1+⟨x,y⟩)dK(x,y)=(1+⟨x,y⟩)dK(\mathbf{x},\mathbf{y}) = (1 + \langle \mathbf{x},\mathbf{y} \rangle)^d Ваш типичный евклидов kNN использует следующую метрику расстояния:...

12
Количество значащих цифр для отчета

Существует ли более научный способ определения количества значащих цифр, сообщаемых для среднего значения или доверительного интервала в ситуации, которая является довольно стандартной - например, первый год обучения в колледже. Я видел количество значащих цифр в таблице : почему мы не используем...

12
Интерпретация результата кластеризации k-средних в R

Я использовал kmeansинструкцию R для выполнения алгоритма k-средних в наборе данных радужной оболочки глаза Андерсона. У меня есть вопрос о некоторых параметрах, которые я получил. Результаты: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 В...

12
Прогнозирование данных счета со случайным лесом

Можно ли обучить Случайный Лес для правильного прогнозирования данных счета? Как это будет продолжаться? У меня довольно широкий диапазон значений, поэтому классификация не имеет смысла. Если бы я использовал регрессию, я бы просто усек результат? Я совершенно потерян здесь. Есть...

12
Стратегия подгонки сильно нелинейной функции

Для анализа данных из биофизического эксперимента в настоящее время я пытаюсь выполнить подгонку кривой с помощью высоко нелинейной модели. Функция модели выглядит в основном так: Y= а х + б х- 1 / 2y=ax+bx−1/2y = ax + bx^{-1/2} Здесь, особенно значение представляет большой интерес.бbb Сюжет для...

12
Пакеты выбора функций в R, которые выполняют регрессию и классификацию

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я очень плохо знаком с R. Я сейчас учусь машинному обучению. Очень жаль, если этот вопрос кажется очень простым. Я...

12
Как проверить избыточную дисперсию в пуассоновском GLMM с помощью lmer () в R?

У меня есть следующая модель: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... и это сводный результат. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare +...

12
Первые шаги в обучении для прогнозирования финансовых временных рядов с использованием машинного обучения

Я пытаюсь понять, как использовать машинное обучение для прогнозирования финансовых временных рядов на 1 или более шагов в будущее. У меня есть финансовые временные ряды с некоторыми описательными данными, и я хотел бы сформировать модель и затем использовать модель для прогнозирования n шагов...