Вопросы с тегом «r»

10

Ответы на этот вопрос по SO вернули набор из примерно 125 одно- или двухбуквенных имен: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-объекты [1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C" [14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs"...

r data-visualization

10

Линейная регрессия с факторами в R

Я пытаюсь понять, как именно факторы работают в R. Допустим, я хочу запустить регрессию, используя некоторые примеры данных в R: > data(CO2) > colnames(CO2) [1] "Plant" "Type" "Treatment" "conc" "uptake" > levels(CO2$Type) [1] "Quebec" "Mississippi" > levels(CO2$Treatment) [1]...

r regression interaction

10

Улучшение SVM классификации диабета

Я использую SVM для прогнозирования диабета. Я использую набор данных BRFSS для этой цели. Набор данных имеет размеры и искажен. Процент s в целевой переменной составляет тогда как s составляют оставшиеся .432607 × 136432607×136432607 \times 136Y11 %11%11\%N89 %89%89\% Я использую только 15из...

r classification svm feature-selection e1071

10

Как проверить гипотезу, что корреляция равна заданному значению, используя R?

Есть ли функция для проверки гипотезы, что корреляция двух векторов равна заданному числу, скажем, 0,75? Используя cor.test, я могу проверить cor = 0 и посмотреть, находится ли 0,75 внутри доверительного интервала. Но есть ли функция для вычисления значения p для cor = 0,75? x <- rnorm(10) y...

r correlation

10

Фильтр Калмана против сглаживания сплайнов

Вопрос: Для каких данных целесообразно использовать моделирование пространства состояний и фильтрацию Калмана вместо сглаживания сплайнов и наоборот? Есть ли какие-то отношения эквивалентности между ними? Я пытаюсь получить общее представление о том, как эти методы сочетаются друг с другом. Я...

kalman-filter splines state-space-models

10

Проверка гипотез и общее расстояние изменения против расхождения Кульбака-Лейблера

В своем исследовании я столкнулся со следующей общей проблемой: у меня есть два распределения и в одной и той же области и большое (но конечное) число выборок из этих распределений. Выборки независимо и идентично распределяются из одного из этих двух распределений (хотя распределения могут быть...

hypothesis-testing mathematical-statistics kullback-leibler information-theory bounds

10

Как сделать ROC-анализ в R с помощью модели Кокса

Я создал несколько моделей регрессии Кокса, и мне хотелось бы посмотреть, насколько хорошо работают эти модели, и я подумал, что, возможно, ROC-кривая или c-статистика могут быть полезны, как в этой статье: JN Armitage och JH van der Meulen, «Идентификация сопутствующей патологии у хирургических...

r survival roc

10

Прогнозирование отклика по новым кривым с использованием пакета fda в R

В основном, все, что я хочу сделать, это предсказать скалярный ответ, используя некоторые кривые. Я дошел до регрессии (используя fRegress из пакета fda), но не знаю, как применить результаты к НОВОМУ набору кривых (для прогнозирования). У меня N = 536 кривых и 536 скалярных ответов. Вот что я...

r functional-data-analysis

10

Вывод LaTeX для объекта R Summary.lm - при отображении информации вне таблицы [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 3 года назад . Это казалось мне базовым, но я не могу найти решение онлайн, поэтому я подумал, что мне не хватает. Я...

r regression

10

Размер дерева при увеличении градиентного дерева

Повышение градиентного дерева, предложенное Фридманом, использует деревья решений с Jконечными узлами (= листья) в качестве базовых обучающихся. Есть несколько способов вырастить дерево с точно такими же Jузлами, например, вы можете вырастить дерево в глубину или в ширину ... Есть ли установленный...

r cart boosting

10

В R, что является лучшим графическим драйвером для использования графиков в Microsoft Word?

Я использую R для создания аккуратных графиков, которые я использую в документах Microsoft Office. Согласно этой странице , наилучшее качество достигается с помощью драйвера PDF. К сожалению, Word не поддерживает импорт рисунков в формате PDF. Что я должен...

r data-visualization

10

Есть ли способ использовать перекрестную проверку для выбора переменных / признаков в R?

У меня есть набор данных с около 70 переменных, которые я хотел бы сократить. Я хочу использовать CV, чтобы найти наиболее полезные переменные следующим образом. 1) Случайно выберите, скажем, 20 переменных. 2) Используйте stepwise/ LASSO/ lars/ etc для выбора наиболее важных переменных. 3)...

r cross-validation feature-selection random-forest stepwise-regression

10

Многократное моделирование структурного уравнения моделирования

Мне нужно проанализировать набор данных клинической реабилитации. Меня интересуют гипотезы о взаимосвязи между количественным «вкладом» (количеством терапии) и изменениями в состоянии здоровья. Хотя набор данных является относительно небольшим (n ~ 70), мы повторили данные, отражающие временные...

r repeated-measures panel-data sem

10

Доверительный интервал для хи-квадрат

Я пытаюсь найти решение для сравнения двух тестов "хи-квадрат". Точнее, я хочу сравнить результаты двух независимых экспериментов. В этих экспериментах авторы использовали хи-квадрат добротности, чтобы сравнить случайное предположение (ожидаемые частоты) с наблюдаемыми частотами. Два эксперимента...

r confidence-interval chi-squared

10

Почему существует значение R ^ 2 (и что его определяет), когда lm не имеет дисперсии в прогнозируемом значении?

Рассмотрим следующий код R: example <- function(n) { X <- 1:n Y <- rep(1,n) return(lm(Y~X)) } #(2.13.0, i386-pc-mingw32) summary(example(7)) #R^2 = .1963 summary(example(62)) #R^2 = .4529 summary(example(4540)) #R^2 = .7832 summary(example(104))) #R^2 = 0 #I did a search for n 6:10000, the...

r regression

10

Помощь в моделировании SEM (OpenMx, polycor)

У меня много проблем с одним набором данных, к которому я пытаюсь применить SEM. Мы предполагаем наличие 5 скрытых факторов A, B, C, D, E с показателями соотв. A1 - A5 (упорядоченные факторы), B1 - B3 (количественные), C1, D1, E1 (все три последних упорядоченных фактора, всего 2 уровня для E1. Нас...

r modeling multiple-regression sem

10

Скрещенные случайные эффекты и несбалансированные данные

Я моделирую некоторые данные, где я думаю, что у меня есть два скрещенных случайных эффекта. Но набор данных не сбалансирован, и я не уверен, что нужно сделать, чтобы учесть это. Мои данные - это набор событий. Событие происходит, когда клиент встречается с поставщиком для выполнения задачи,...

r mixed-model random-effects-model logistic

10

Как моделировать многовариантные результаты в R?

В большинстве случаев мы имеем дело только с одной переменной результат / ответ, такой как . Однако в некоторых сценариях, особенно в клинических данных, переменные результата могут быть многомерными / многомерными. Например, , где содержит переменные , и и все эти результаты коррелированы. Если...

r cross-validation

10

Как распределяется ошибка вокруг данных логистического роста?

В экологии мы часто используем уравнение логистического роста: Nt=KN0ertK+N0ert−1Nt=KN0ertK+N0ert−1 N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}} или Nt=KN0N0+(K−N0)e−rtNt=KN0N0+(K−N0)e−rt N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}} где - пропускная способность (достигнута максимальная плотность), -...

r distributions pdf ecology

10

R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...

r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction