Вопросы с тегом «r»

13
Интерпретация и проверка модели регрессии пропорциональных рисков Кокса с использованием R на простом английском языке

Может кто-нибудь объяснить мне мою модель Кокса на простом английском? Я использовал следующую модель регрессии Кокса для всех моих данных, используя cphфункцию. Мои данные сохраняются в объекте под названием Data. Переменные w, xи yнепрерывны; zэто фактор двух уровней. Время измеряется месяцами. У...

13
Проанализируйте пропорции

У меня есть набор данных, содержащий несколько пропорций, которые в сумме составляют 1. Меня интересует изменение этих пропорций вдоль градиента (см. Пример данных ниже). gradient <- 1:99 A1 <- gradient * 0.005 A2 <- gradient * 0.004 A3 <- 1 - (A1 + A2) df <- data.frame(gradient =...

13
Существует ли формула или правило для определения правильного размера выборки для randomForest?

Я играю с randomForest и обнаружил, что обычно увеличение SampSize приводит к повышению производительности. Существует ли правило / формула / и т. Д., В котором предлагается оптимальный размер sampSize или это метод проб и ошибок? Я предполагаю другой способ сформулировать это; каковы мои риски...

13
Проблема с либсвм е1071?

У меня есть набор данных с двумя перекрывающимися классами, семь точек в каждом классе, точки находятся в двухмерном пространстве. В R, и я бегу svmиз e1071пакета, чтобы построить разделяющую гиперплоскость для этих классов. Я использую следующую команду: svm(x, y, scale = FALSE, type =...

13
Рубин как верстак статистики

Это также вопрос, который в значительной степени относится к Python как инструменту статистики и превосходит его как инструмент статистики . Я знаю, что существует большая дискуссия о Ruby против Python, но это не главное в этом вопросе. Я подумал, что Ruby быстрее Python и обладает очень...

13
Что такое чанк-тесты?

В ответ на вопрос о выборе модели в наличии мультиколлинеарности , Франк Харрелл предложил : Поместите все переменные в модель, но не проверяйте влияние одной переменной, скорректированной с учетом влияния конкурирующих переменных ... Кусочные тесты конкурирующих переменных являются мощными, потому...

13
Генерация выборок данных из регрессии Пуассона

Мне было интересно, как вы будете генерировать данные из уравнения регрессии Пуассона в R? Я немного растерялся, как подойти к проблеме. Поэтому, если я предполагаю, что у нас есть два предиктора и X 2, которые распределены N ( 0 , 1 ) . И перехват равен 0, и оба коэффициента равны 1. Тогда моя...

13
Случайный лес: как обрабатывать новые уровни факторов в тестовом наборе?

Я пытаюсь делать прогнозы, используя модель случайного леса в R. Однако я получаю ошибки, так как некоторые факторы имеют разные значения в тестовом наборе, чем в обучающем наборе. Например, фактор Cat_2имеет значения 34, 68, 76и т. Д. В тестовом наборе, которые не отображаются в обучающем наборе....

13
Смешные статистические ответы на экзамен [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 7 лет назад . Исправление экзаменов, наверное, самая скучная задача учителя. Но нам может быть забавно собирать...

13
Прогнозы с использованием glmnet в R

Я пытаюсь смоделировать некоторые данные, используя glmnetпакет в R. Допустим, у меня есть следующие данные training_x <- data.frame(variable1 = c(1, 2, 3, 2, 3), variable2 = c(1, 2, 3, 4, 5)) y <- c(1, 2, 3, 4, 5) (Это упрощение; мои данные намного сложнее.) Затем я использовал следующий код...

13
В чем разница между wilcox.test и coin :: wilcox_test в R?

Эти две функции существуют в R, но я не знаю их различий. Кажется, что они возвращают одинаковые p-значения только при вызове wilcox.testс correct=FALSE, и wilcox_test(в пакете для монет) с distribution="aymptotic". Для других значений они возвращают разные p-значения. Также wilcox.testвсегда...

13
Помогите мне понять в байесовском GLM

Я пытаюсь запустить байесовский логит на данных здесь . Я использую bayesglm()в armпакете в R. Кодирование достаточно просто: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df)...

13
Как получить результаты специального теста Tukey HSD в таблице, показывающей сгруппированные пары?

Я хотел бы выполнить специальный тест TukeyHSD после моей двусторонней Anova с R, получив таблицу, содержащую отсортированные пары, сгруппированные по значительным различиям. (Извините за формулировку, я все еще новичок со статистикой.) Я хотел бы иметь что-то вроде этого: Итак, сгруппированы по...

13
Почему проблема беспорядка неразрешима для больших выборок?

Предположим, у нас есть множество точек y={y1,y2,…,yN}y={y1,y2,…,yN}\mathbf{y} = \{y_1, y_2, \ldots, y_N \} . Каждая точка yiyiy_i генерируется с использованием распределения p(yi|x)=12N(x,1)+12N(0,10).p(yi|x)=12N(x,1)+12N(0,10). p(y_i| x) = \frac12 \mathcal{N}(x, 1) + \frac12 \mathcal{N}(0, 10)....

13
Разница временного ряда до Аримы или внутри Аримы

Лучше ли различать ряды (если это необходимо) перед использованием Arima ИЛИ лучше использовать параметр d в Arima? Я был удивлен тем, насколько разные подходящие значения зависят от того, какой маршрут выбран с той же моделью и данными. Или я что-то делаю неправильно? install.packages("forecast")...

13
Действительно ли компоненты PCA представляют собой процент дисперсии? Могут ли они составить более 100%?

«Машинное обучение для хакеров» О'Рейли говорит, что каждый основной компонент представляет собой процент дисперсии. Я процитировал соответствующую часть страницы ниже (глава 8, с.207). Говоря с другим экспертом, они согласились, что это процент. Однако 24 компонента составляют 133,2095%. Как это...

13
Линейная регрессия и пространственная автокорреляция

Я хочу предсказать высоту деревьев в определенной области, используя некоторые переменные, полученные с помощью дистанционного зондирования. Как приблизительная биомасса и т. Д. Я хочу сначала использовать линейную регрессию (я знаю, что это не лучшая идея, но это обязательный шаг для моего...

13
Числовые решатели для стохастических дифференциальных уравнений в R: есть ли?

Я ищу общий, чистый и быстрый (т. Е. Использующий подпрограммы C ++) R-пакет для имитации путей из неоднородной нелинейной диффузии типа (1) с использованием схемы Эйлера-Маруямы, схемы Мильштейна (или любой другой). Это предназначено для встраивания в больший код оценки и поэтому заслуживает...

13
Не отрицательная лассо реализация в R

Я ищу какой-нибудь открытый исходный код или существующую библиотеку, которую я могу использовать. Насколько я знаю, пакет glmnet не очень легко расширяется, чтобы охватить неотрицательный случай. Я могу ошибаться, Любой, у кого есть идеи, высоко ценится. Под неотрицательным я подразумеваю, что все...

13
Существует ли пакет R для продольных двоичных откликов с непрерывным временем?

bildПакет , кажется, превосходный пакет для последовательных бинарных ответов. Но это на дискретное время. Я хотел бы указать плавную функцию времени для связи отношения шансов текущего отклика Y с двоичными откликами, измеренными в более ранние времена, или, по крайней мере, марковской версией...