Вопросы с тегом «r»

15
Как построить функцию ступеней лестницы с помощью ggplot?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. У меня есть график, как это: R код для его генерации: DF <- data.frame(date = as.Date(runif(100, 0,...

15
Разбиение деревьев в R: партия против rpart

Прошло много времени с тех пор, как я посмотрел на разделение деревьев. В прошлый раз, когда я делал подобные вещи, мне нравилась вечеринка в R (созданная Hothorn). Идея условного вывода через выборку имеет для меня смысл. Но у rpart тоже была апелляция. В текущем приложении (я не могу дать...

15
Какой хороший подход к обучению R в компьютерной лаборатории?

Было несколько хороших вопросов и наборов ответов на вводные книги или подходы к обучению, например, здесь и здесь . Но у меня немного другая проблема - лучший способ запустить часовой сеанс (или несколько таких сеансов) в компьютерном классе, который поможет людям начать работать с R, знаком с его...

15
Противоречивые результаты типа квадратов суммы квадратов в ANOVA в SAS и R

Я анализирую данные несбалансированного факторного эксперимента как с, так SASи с R. Оба SASи Rдают одинаковую сумму квадратов типа I, но их сумма квадратов типа III отличается друг от друга. Ниже приведены SASи Rкоды и выводы. DATA ASD; INPUT Y T B; DATALINES; 20 1 1 25 1 2 26 1 2 22 1 3 25 1 3 25...

15
Есть ли способ отключить функцию настройки параметров (сетки) в CARET?

CARET автоматически использует предварительно заданную сетку настройки для построения различных моделей перед выбором окончательной модели, а затем обучает окончательную модель полным данным обучения. Я могу предоставить свою собственную сетку настройки только с одной комбинацией параметров. Однако...

15
Как получить R-квадрат для лессов?

Как рассчитать R-квадрат ( ) статистики в R для и / или выхода функции? Например, для этих данных:р2р2r^2loesspredict cars.lo <- loess(dist ~ speed, cars) cars.lp <- predict(cars.lo, data.frame(speed = seq(5, 30, 1)), se = TRUE) cars.lpимеет два массива fitдля модели и se.fitдля стандартной...

15
Как расширить фрейм данных в R

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. У меня возникла следующая проблема при проведении анализа с R. У меня есть такой кадр данных: Name | Group | Count...

15
Лучший способ визуализировать истощение, используя R?

Через этот сайт я недавно обнаружил диаграммы Санки, отличный способ визуализировать то, что происходит в традиционной блок-схеме. Вот хороший пример диаграммы Санки Джорджа М. Уайтсайда и Джорджа В. Крэбтри , источник; Не забывайте долгосрочные фундаментальные исследования в области энергетики ,...

15
Как проверить влияние группирующей переменной с нелинейной моделью?

У меня есть вопрос относительно использования группирующей переменной в нелинейной модели. Поскольку функция nls () не учитывает факторные переменные, я изо всех сил пытался выяснить, можно ли проверить влияние фактора на подбор модели. Ниже я привел пример, где я хочу приспособить модель роста...

15
Почему оценки коэффициента регрессии rlm () отличаются от lm () в R?

Я использую rlm в пакете R MASS для регрессии многомерной линейной модели. Это хорошо работает для ряда образцов, но я получаю квазинулевые коэффициенты для конкретной модели: Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit) Residuals: Min 1Q Median 3Q Max...

15
Нахождение локальных экстремумов функции плотности с использованием сплайнов

Я пытаюсь найти локальные максимумы для функции плотности вероятности (найдены с использованием densityметода R ). Я не могу сделать простой метод «осмотреть соседей» (когда нужно осмотреть точку, чтобы увидеть, является ли это локальным максимумом по отношению к ее соседям), поскольку существует...

15
Генерация трех коррелированных равномерно распределенных случайных величин

Предположим, у нас есть Икс1∼ униф ( n , 0 , 1 ) ,Икс1~UNIF(N,0,1),X_1 \sim \textrm{unif}(n,0,1), Икс2~ unif (n,0,1),Икс2~UNIF(N,0,1),X_2 \sim \textrm{unif}(n,0,1), где - равномерная случайная выборка размером n, иunif (n,0,1 )UNIF(N,0,1)\textrm{unif}(n,0,1) Y= Х1,Yзнак равноИкс1,Y=X_1, Z= 0,4 х1+...

15
Какие варианты в модели пропорциональной регрессии рисков, когда остатки Шенфельда не хороши?

Я делаю пропорциональную регрессию рисков Кокса в R, используя coxphмножество переменных. Остатки Мартингейла выглядят великолепно, а остатки Шенфельда отлично подходят для ПОЧТИ всех переменных. Есть три переменные, чьи остатки Шенфельда не плоские, и природа переменных такова, что имеет смысл,...

15
Как выбрать метрику ошибки при оценке классификатора?

Я видел разные метрики ошибок, используемые в соревнованиях Kaggle: RMS, среднее значение, AUC и другие. Каково общее правило выбора метрики ошибки, т. Е. Как узнать, какую метрику ошибки использовать для данной проблемы? Есть ли...

15
Библиотека Java с открытым исходным кодом для статистики на уровне, предлагаемом курсом статистики выпускников

Я прохожу аспирантуру по прикладной статистике, в которой используется следующий учебник (чтобы дать вам представление об уровне освещаемого материала): Статистические концепции и методы , автор Г.К. Бхаттачарья и Р.А. Джонсон. Профессор требует от нас использовать SAS для домашних заданий. Мой...

15
Визуализация результатов смешанной модели

Одна из проблем, с которыми я всегда сталкивался при работе со смешанными моделями, это выяснение визуализаций данных - таких, которые могут оказаться на бумаге или плакате, - как только кто-то получит результаты. Сейчас я работаю над моделью смешанных эффектов Пуассона с формулой, которая выглядит...

15
Зачем использовать определенную меру ошибки прогноза (например, MAD), а не другую (например, MSE)?

MAD = среднее абсолютное отклонение MSE = средняя квадратическая ошибка Я видел предложения из разных мест о том, что MSE используется, несмотря на некоторые нежелательные качества (например, http://www.stat.nus.edu.sg/~staxyc/T12.pdf , где говорится на стр. 8). Обычно считается, что MAD является...

15
Значение выходных терминов в пакете gbm?

Я использую пакет gbm для классификации. Как и следовало ожидать, результаты хорошие. Но я пытаюсь понять вывод классификатора. В выводе пять терминов. `Iter TrainDeviance ValidDeviance StepSize Improve` Может ли кто-нибудь объяснить значение каждого термина, особенно значение улучшения...

15
Оценка параметров нормального распределения: медиана вместо среднего?

Общий подход для оценки параметров нормального распределения заключается в использовании среднего значения и стандартного отклонения / дисперсии выборки. Однако, если есть некоторые выбросы, медиана и срединное отклонение от медианы должны быть намного более устойчивыми, верно? На некоторых наборах...

15
Как оценить пуассоновский процесс с помощью R? (Или: как использовать пакет NHPoisson?)

У меня есть база данных событий (то есть переменная дат) и связанных ковариат. События генерируются нестационарным пуассоновским процессом с параметром, являющимся неизвестной (но, возможно, линейной) функцией некоторых ковариат. Я думаю, что пакет NHPoisson существует только для этой цели; но...