Вопросы с тегом «r»

36
Как мне узнать, какой метод перекрестной проверки является лучшим?

Я пытаюсь выяснить, какой метод перекрестной проверки лучше всего подходит для моей ситуации. Следующие данные являются лишь примером для проработки проблемы (в R), но мои реальные Xданные ( xmat) связаны друг с другом и в разной степени связаны с yпеременной ( ymat). Я предоставил код R, но мой...

36
Создание «оценки достоверности» из голосов в случайных лесах?

Я рассчитываю обучить классификатор, который будет различать объекты Type Aи Type Bобъекты с достаточно большим обучающим набором, состоящим примерно из 10 000 объектов, около половины из которых есть, Type Aа половина из них Type B. Набор данных состоит из 100 непрерывных элементов, детализирующих...

36
Насколько достоверны доверительные интервалы для lmer объектов через пакет эффектов?

EffectsПакет предоставляет очень быстрый и удобный способ для построения результатов линейной модели смешанного эффекта, полученных с помощью lme4пакета . В effectфункции вычисляет доверительные интервалы (ДИ) очень быстро, но , как заслуживающие доверия этих доверительные интервалы? Например:...

36
Как мне подогнать ограниченную регрессию в R, чтобы коэффициенты всего = 1?

Я вижу похожую ограниченную регрессию здесь: Ограниченная линейная регрессия через указанную точку но мое требование немного отличается. Мне нужно, чтобы коэффициенты сложились в единицу. В частности, я регрессирую доходность 1 ряда валют против 3 других валютных рядов, чтобы инвесторы могли...

36
Почему распределение Дирихле является приоритетным для многочленного распределения?

В алгоритме модели темы LDA я видел это предположение. Но я не знаю, почему выбрал дистрибутив Дирихле? Я не знаю, можем ли мы использовать равномерное распределение по многочлену в...

36
Как оценить параметр усадки в лассо или гребень регрессии с> 50K переменных?

Я хочу использовать регрессию Лассо или Риджа для модели с более чем 50 000 переменных. Я хочу сделать это, используя программный пакет в R. Как я могу оценить параметр усадки ( )?λλ\lambda Редактирование: Вот точка, до которой я добрался: set.seed (123) Y <- runif (1000) Xv <- sample(c(1,0),...

36
Как интерпретировать glmnet?

Я пытаюсь согласовать многомерную модель линейной регрессии с приблизительно 60 предикторами и 30 наблюдениями, поэтому я использую пакет glmnet для регуляризованной регрессии, потому что p> n. Я просматривал документацию и другие вопросы, но все еще не могу интерпретировать результаты, вот...

36
Временные функции в R [закрыто]

Я хотел бы измерить время, необходимое для повторного запуска функции. replicate()Эквивалентны ли циклы for и используются ли они ? Например: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Какой предпочтительный метод. В выводе system.time(), является sys+userфактическое...

36
Как квази сопоставить два вектора строк (в R)?

Я не уверен, как это следует называть, поэтому, пожалуйста, поправьте меня, если вы знаете лучший термин. У меня есть два списка. Один из 55 элементов (например, вектор строк), другой из 92. Имена элементов похожи, но не идентичны. Я хочу , чтобы найти лучший кандидат S в 92 списке элементов в...

36
Альтернативы одностороннему ANOVA для гетероскедастических данных

У меня есть данные от 3 групп биомассы водорослей ( , , ), которые содержат неравные размеры выборки ( , , ), и я хотел бы сравнить, если эти группы принадлежат к одной популяции.B C n A = 15 n B = 13 n C = 12AAABBBCCCnA=15nA=15n_A=15nB=13nB=13n_B=13nC=12nC=12n_C=12 Односторонний ANOVA определенно...

36
Платформы облачных вычислений для машинного обучения [закрыто]

У меня есть небольшой список компаний, которые предоставляют платформу для запуска R, Python или октавных сценариев на кластерах, построенных на основе Amazon EC2. Есть ли другие имена, которые я должен добавить? Cloudnumbers Opani crdata...

36
Хорошие методы для графиков плотности неотрицательных переменных в R?

plot(density(rexp(100)) Очевидно, что вся плотность слева от нуля представляет собой смещение. Я хочу обобщить некоторые данные для статистиков, и я хочу избежать вопросов о том, почему неотрицательные данные имеют плотность слева от нуля. Графики для проверки рандомизации; Я хочу показать...

36
Почему знаменатель оценки ковариации не должен быть n-2, а не n-1?

Знаменатель (несмещенной) оценки дисперсии равен поскольку имеется наблюдений и оценивается только один параметр.n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Кроме того, мне интересно, почему...

36
Как интерпретировать коэффициенты из подгонки полиномиальной модели?

Я пытаюсь создать полином второго порядка, соответствующий некоторым имеющимся у меня данным. Допустим, я заговорю это подходит с ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Я получил: Таким образом, подгонка второго порядка работает...

35
Что хорошего в использовании функции 'comment' в R?

Я только что обнаружил commentфункцию в R. Пример: x <- matrix(1:12, 3,4) comment(x) <- c("This is my very important data from experiment #0234", "Jun 5, 1998") x comment(x) Это первый раз, когда я пришел с этой функцией, и мне было интересно, как часто / полезно ее использовать. Так как в...

35
Почему увеличение размера выборки уменьшает дисперсию (выборку)?

Большая фотография: Я пытаюсь понять, как увеличение размера выборки увеличивает мощность эксперимента. Слайды моего лектора объясняют это картиной из 2 нормальных распределений, одно для нулевой гипотезы и одно для альтернативной гипотезы и порога принятия решения c между ними. Они утверждают, что...

35
Что такое остаточная стандартная ошибка?

При запуске модели множественной регрессии в R один из выходных сигналов представляет собой остаточную стандартную ошибку 0,0589 при 95 161 степени свободы. Я знаю, что 95 161 степень свободы определяется разницей между количеством наблюдений в моей выборке и количеством переменных в моей модели....

35
Квантильная регрессия: какие стандартные ошибки?

summary.rqФункция от quantreg виньетки предоставляет множество вариантов для стандартных оценок погрешности квантилей коэффициентов регрессии. Каковы специальные сценарии, когда каждый из них становится оптимальным / желательным? «ранг», который дает доверительные интервалы для оцененных параметров...

35
Что такое скорректированная формула R-квадрата в lm в R и как ее следует интерпретировать?

Какая точная формула используется в R lm() для Скорректированного R-квадрата? Как я могу интерпретировать это? Скорректированные R-квадрат формулы Кажется, существует несколько формул для расчета скорректированного R-квадрата. Формула...

35
Линейность PCA

PCA считается линейной процедурой, однако: PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), где . Это означает, что собственные векторы, полученные PCA на матрицах данных , не суммируют до равных...