Вопросы с тегом «r»

29
Интерпретация теста Шапиро-Вилка

Я довольно плохо знаком со статистикой, и мне нужна ваша помощь. У меня есть небольшой образец, как показано ниже: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Я выполнил тест Шапиро-Уилка, используя R: shapiro.test(precisionH4U$H4U) и я получил следующий результат: W = 0.9502, p-value =...

29
Пакеты R для выполнения тематического моделирования / LDA: просто `topicmodels` и` lda` [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Мне кажется, что только два пакета R способны выполнять скрытое выделение Дирихле : Один из них lda,...

29
Как выполнить ортогональную регрессию (наименьших квадратов) с помощью PCA?

Я всегда использую lm()в R для выполнения линейной регрессии yyy на xxx . Эта функция возвращает коэффициент ββ\beta такой, что y=βx.y=βx.y = \beta x. Сегодня я узнал об общих наименьших квадратах, и эту princomp()функцию (анализ основных компонентов, PCA) можно использовать для ее выполнения. Это...

29
Ошибка «система вычислительно единственная» при запуске GLM

Я использую пакет robustbase для запуска оценки glm. Однако, когда я делаю это, я получаю следующую ошибку: Error in solve.default(crossprod(X, DiagB * X)/nobs, EEq) : system is computationally singular: reciprocal condition number = 1.66807e-16 Что это значит / указывает? И как я могу это...

29
Как стандартные ошибки вычисляются для подобранных значений из логистической регрессии?

Когда вы прогнозируете подходящее значение из модели логистической регрессии, как рассчитываются стандартные ошибки? Я имею в виду для подогнанных значений , а не для коэффициентов (которые включают информационную матрицу Фишера). Я только узнал, как получить числа R(например, здесь, в r-help, или...

29
R: Случайный лес, выбрасывающий NaN / Inf в ошибке «вызова сторонней функции», несмотря на отсутствие NaN в наборе данных [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Я использую каретку, чтобы запустить перекрестный проверенный случайный лес по набору данных. Переменная...

29
Выбор характеристик и модель с glmnet по данным метилирования (p >> N)

Я хотел бы использовать GLM и Elastic Net, чтобы выбрать эти релевантные функции + построить модель линейной регрессии (т. Е. Как прогнозирование, так и понимание, поэтому было бы лучше оставить с относительно небольшим количеством параметров). Выход непрерывный. Это генов на случаев. Я читал об...

29
Вычислить матрицу перехода (Маркова) в R

Есть ли способ в R (встроенная функция) вычислить матрицу переходов для цепи Маркова из набора наблюдений? Например, взять набор данных, подобный следующему, и вычислить матрицу перехода первого порядка? dat<-data.frame(replicate(20,sample(c("A", "B", "C","D"), size = 100,...

29
Какой тест я могу использовать для сравнения уклонов двух или более регрессионных моделей?

Я хотел бы проверить разницу в ответе двух переменных на один предиктор. Вот минимальный воспроизводимый пример. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <-...

28
Какие-нибудь предложения для того, чтобы заставить код R использовать несколько процессоров?

У меня есть R-скрипты для чтения больших объемов данных CSV из разных файлов, а затем выполнять задачи машинного обучения, такие как SVM для классификации. Существуют ли какие-либо библиотеки для использования нескольких ядер на сервере R. или Каков наиболее подходящий способ достижения...

28
Каковы опасности нарушения предположения о гомоскедастичности для линейной регрессии?

В качестве примера рассмотрим ChickWeightнабор данных в R. Разница, очевидно, со временем увеличивается, поэтому, если я использую простую линейную регрессию, например: m <- lm(weight ~ Time*Diet, data=ChickWeight) Мои вопросы: Какие аспекты модели будут сомнительными? Проблемы ограничены...

28
Как интерпретировать дисперсию и корреляцию случайных эффектов в модели смешанных эффектов?

Я надеюсь, что вы все не возражаете против этого вопроса, но мне нужна помощь в интерпретации выходных данных для выходных данных модели линейных смешанных эффектов, которые я пытался научиться делать в R. Я новичок в продольном анализе данных и регрессии линейных смешанных эффектов. У меня есть...

28
Как сделать уменьшение размерности в R

У меня есть матрица, где a (i, j) говорит мне, сколько раз я просмотрел страницу j. Есть 27 тысяч человек и 95 тысяч страниц. Я хотел бы иметь несколько «измерений» или «аспектов» в пространстве страниц, которые соответствуют наборам страниц, которые часто просматриваются вместе. Моя конечная цель...

28
Становится серьезно о временных рядах с R

Если вспомнить, когда вы впервые начали анализ временных рядов. Какие инструменты, пакеты R и интернет-ресурсы вы хотели бы знать? Я пытаюсь спросить: с чего начать? В частности, есть ли ресурсы для R, которые действительно сводят его к тому, кто «новичок» в анализе временных рядов с...

28
Кому следовать на github, чтобы узнать о передовом опыте в анализе данных?

Полезно изучить код анализа данных экспертов. Недавно я просматривал github, и многие люди делятся там кодом анализа данных. Это включает в себя несколько пакетов R (которые, конечно, доступны непосредственно из CRAN), а также несколько примеров воспроизводимых исследований, особенно с...

28
Почему и когда создается пакет R?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я понимаю, что этот вопрос довольно широкий, но мне интересно, какими должны быть решающие моменты при принятии решения...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...

28
Насколько некорректна модель регрессии, когда предположения не выполняются?

При подборе регрессионной модели, что произойдет, если предположения о выходных данных не будут выполнены, а именно Что произойдет, если остатки не будут гомоскедастичными? Если остатки показывают растущий или убывающий паттерн на графике Остатки против Приспособленного. Что произойдет, если...

28
Почему регрессия glmnet ridge дает мне другой ответ, чем ручной расчет?

Я использую glmnet для расчета оценок регрессии гребня. Я получил некоторые результаты, которые сделали меня подозрительным в том, что glmnet действительно делает то, что я думаю, что делает. Чтобы проверить это, я написал простой R-скрипт, в котором я сравниваю результат регрессии гребня,...