Вопросы с тегом «r»

10
Визуализация 2-буквенных комбинаций

Ответы на этот вопрос по SO вернули набор из примерно 125 одно- или двухбуквенных имен: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-объекты [1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C" [14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs"...

10
Линейная регрессия с факторами в R

Я пытаюсь понять, как именно факторы работают в R. Допустим, я хочу запустить регрессию, используя некоторые примеры данных в R: > data(CO2) > colnames(CO2) [1] "Plant" "Type" "Treatment" "conc" "uptake" > levels(CO2$Type) [1] "Quebec" "Mississippi" > levels(CO2$Treatment) [1]...

10
Улучшение SVM классификации диабета

Я использую SVM для прогнозирования диабета. Я использую набор данных BRFSS для этой цели. Набор данных имеет размеры и искажен. Процент s в целевой переменной составляет тогда как s составляют оставшиеся .432607 × 136432607×136432607 \times 136Y11 %11%11\%N89 %89%89\% Я использую только 15из...

10
Как проверить гипотезу, что корреляция равна заданному значению, используя R?

Есть ли функция для проверки гипотезы, что корреляция двух векторов равна заданному числу, скажем, 0,75? Используя cor.test, я могу проверить cor = 0 и посмотреть, находится ли 0,75 внутри доверительного интервала. Но есть ли функция для вычисления значения p для cor = 0,75? x <- rnorm(10) y...

10
Фильтр Калмана против сглаживания сплайнов

Вопрос: Для каких данных целесообразно использовать моделирование пространства состояний и фильтрацию Калмана вместо сглаживания сплайнов и наоборот? Есть ли какие-то отношения эквивалентности между ними? Я пытаюсь получить общее представление о том, как эти методы сочетаются друг с другом. Я...

10
Проверка гипотез и общее расстояние изменения против расхождения Кульбака-Лейблера

В своем исследовании я столкнулся со следующей общей проблемой: у меня есть два распределения и в одной и той же области и большое (но конечное) число выборок из этих распределений. Выборки независимо и идентично распределяются из одного из этих двух распределений (хотя распределения могут быть...

10
Как сделать ROC-анализ в R с помощью модели Кокса

Я создал несколько моделей регрессии Кокса, и мне хотелось бы посмотреть, насколько хорошо работают эти модели, и я подумал, что, возможно, ROC-кривая или c-статистика могут быть полезны, как в этой статье: JN Armitage och JH van der Meulen, «Идентификация сопутствующей патологии у хирургических...

10
Прогнозирование отклика по новым кривым с использованием пакета fda в R

В основном, все, что я хочу сделать, это предсказать скалярный ответ, используя некоторые кривые. Я дошел до регрессии (используя fRegress из пакета fda), но не знаю, как применить результаты к НОВОМУ набору кривых (для прогнозирования). У меня N = 536 кривых и 536 скалярных ответов. Вот что я...

10
Вывод LaTeX для объекта R Summary.lm - при отображении информации вне таблицы [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 3 года назад . Это казалось мне базовым, но я не могу найти решение онлайн, поэтому я подумал, что мне не хватает. Я...

10
Размер дерева при увеличении градиентного дерева

Повышение градиентного дерева, предложенное Фридманом, использует деревья решений с Jконечными узлами (= листья) в качестве базовых обучающихся. Есть несколько способов вырастить дерево с точно такими же Jузлами, например, вы можете вырастить дерево в глубину или в ширину ... Есть ли установленный...

10
В R, что является лучшим графическим драйвером для использования графиков в Microsoft Word?

Я использую R для создания аккуратных графиков, которые я использую в документах Microsoft Office. Согласно этой странице , наилучшее качество достигается с помощью драйвера PDF. К сожалению, Word не поддерживает импорт рисунков в формате PDF. Что я должен...

10
Есть ли способ использовать перекрестную проверку для выбора переменных / признаков в R?

У меня есть набор данных с около 70 переменных, которые я хотел бы сократить. Я хочу использовать CV, чтобы найти наиболее полезные переменные следующим образом. 1) Случайно выберите, скажем, 20 переменных. 2) Используйте stepwise/ LASSO/ lars/ etc для выбора наиболее важных переменных. 3)...

10
Многократное моделирование структурного уравнения моделирования

Мне нужно проанализировать набор данных клинической реабилитации. Меня интересуют гипотезы о взаимосвязи между количественным «вкладом» (количеством терапии) и изменениями в состоянии здоровья. Хотя набор данных является относительно небольшим (n ~ 70), мы повторили данные, отражающие временные...

10
Доверительный интервал для хи-квадрат

Я пытаюсь найти решение для сравнения двух тестов "хи-квадрат". Точнее, я хочу сравнить результаты двух независимых экспериментов. В этих экспериментах авторы использовали хи-квадрат добротности, чтобы сравнить случайное предположение (ожидаемые частоты) с наблюдаемыми частотами. Два эксперимента...

10
Почему существует значение R ^ 2 (и что его определяет), когда lm не имеет дисперсии в прогнозируемом значении?

Рассмотрим следующий код R: example <- function(n) { X <- 1:n Y <- rep(1,n) return(lm(Y~X)) } #(2.13.0, i386-pc-mingw32) summary(example(7)) #R^2 = .1963 summary(example(62)) #R^2 = .4529 summary(example(4540)) #R^2 = .7832 summary(example(104))) #R^2 = 0 #I did a search for n 6:10000, the...

10
Помощь в моделировании SEM (OpenMx, polycor)

У меня много проблем с одним набором данных, к которому я пытаюсь применить SEM. Мы предполагаем наличие 5 скрытых факторов A, B, C, D, E с показателями соотв. A1 - A5 (упорядоченные факторы), B1 - B3 (количественные), C1, D1, E1 (все три последних упорядоченных фактора, всего 2 уровня для E1. Нас...

10
Скрещенные случайные эффекты и несбалансированные данные

Я моделирую некоторые данные, где я думаю, что у меня есть два скрещенных случайных эффекта. Но набор данных не сбалансирован, и я не уверен, что нужно сделать, чтобы учесть это. Мои данные - это набор событий. Событие происходит, когда клиент встречается с поставщиком для выполнения задачи,...

10
Как моделировать многовариантные результаты в R?

В большинстве случаев мы имеем дело только с одной переменной результат / ответ, такой как . Однако в некоторых сценариях, особенно в клинических данных, переменные результата могут быть многомерными / многомерными. Например, , где содержит переменные , и и все эти результаты коррелированы. Если...

10
Как распределяется ошибка вокруг данных логистического роста?

В экологии мы часто используем уравнение логистического роста: Nt=KN0ertK+N0ert−1Nt=KN0ertK+N0ert−1 N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}} или Nt=KN0N0+(K−N0)e−rtNt=KN0N0+(K−N0)e−rt N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}} где - пропускная способность (достигнута максимальная плотность), -...

10
R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод,...