Вопросы с тегом «r»

36

Как мне узнать, какой метод перекрестной проверки является лучшим?

Я пытаюсь выяснить, какой метод перекрестной проверки лучше всего подходит для моей ситуации. Следующие данные являются лишь примером для проработки проблемы (в R), но мои реальные Xданные ( xmat) связаны друг с другом и в разной степени связаны с yпеременной ( ymat). Я предоставил код R, но мой...

r regression cross-validation linear-model

36

Создание «оценки достоверности» из голосов в случайных лесах?

Я рассчитываю обучить классификатор, который будет различать объекты Type Aи Type Bобъекты с достаточно большим обучающим набором, состоящим примерно из 10 000 объектов, около половины из которых есть, Type Aа половина из них Type B. Набор данных состоит из 100 непрерывных элементов, детализирующих...

r machine-learning random-forest

36

Насколько достоверны доверительные интервалы для lmer объектов через пакет эффектов?

EffectsПакет предоставляет очень быстрый и удобный способ для построения результатов линейной модели смешанного эффекта, полученных с помощью lme4пакета . В effectфункции вычисляет доверительные интервалы (ДИ) очень быстро, но , как заслуживающие доверия этих доверительные интервалы? Например:...

r mixed-model confidence-interval effects lme4-nlme

36

Как мне подогнать ограниченную регрессию в R, чтобы коэффициенты всего = 1?

Я вижу похожую ограниченную регрессию здесь: Ограниченная линейная регрессия через указанную точку но мое требование немного отличается. Мне нужно, чтобы коэффициенты сложились в единицу. В частности, я регрессирую доходность 1 ряда валют против 3 других валютных рядов, чтобы инвесторы могли...

r regression

36

Почему распределение Дирихле является приоритетным для многочленного распределения?

В алгоритме модели темы LDA я видел это предположение. Но я не знаю, почему выбрал дистрибутив Дирихле? Я не знаю, можем ли мы использовать равномерное распределение по многочлену в...

bayesian dirichlet-distribution conjugate-prior

36

Как оценить параметр усадки в лассо или гребень регрессии с> 50K переменных?

Я хочу использовать регрессию Лассо или Риджа для модели с более чем 50 000 переменных. Я хочу сделать это, используя программный пакет в R. Как я могу оценить параметр усадки ( )?λλ\lambda Редактирование: Вот точка, до которой я добрался: set.seed (123) Y <- runif (1000) Xv <- sample(c(1,0),...

r lasso ridge-regression high-dimensional

36

Как интерпретировать glmnet?

Я пытаюсь согласовать многомерную модель линейной регрессии с приблизительно 60 предикторами и 30 наблюдениями, поэтому я использую пакет glmnet для регуляризованной регрессии, потому что p> n. Я просматривал документацию и другие вопросы, но все еще не могу интерпретировать результаты, вот...

r regression regularization glmnet

36

Временные функции в R [закрыто]

Я хотел бы измерить время, необходимое для повторного запуска функции. replicate()Эквивалентны ли циклы for и используются ли они ? Например: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); Какой предпочтительный метод. В выводе system.time(), является sys+userфактическое...

r

36

Как квази сопоставить два вектора строк (в R)?

Я не уверен, как это следует называть, поэтому, пожалуйста, поправьте меня, если вы знаете лучший термин. У меня есть два списка. Один из 55 элементов (например, вектор строк), другой из 92. Имена элементов похожи, но не идентичны. Я хочу , чтобы найти лучший кандидат S в 92 списке элементов в...

r text-mining

36

Альтернативы одностороннему ANOVA для гетероскедастических данных

У меня есть данные от 3 групп биомассы водорослей ( , , ), которые содержат неравные размеры выборки ( , , ), и я хотел бы сравнить, если эти группы принадлежат к одной популяции.B C n A = 15 n B = 13 n C = 12AAABBBCCCnA=15nA=15n_A=15nB=13nB=13n_B=13nC=12nC=12n_C=12 Односторонний ANOVA определенно...

r anova data-transformation heteroscedasticity

36

Платформы облачных вычислений для машинного обучения [закрыто]

У меня есть небольшой список компаний, которые предоставляют платформу для запуска R, Python или октавных сценариев на кластерах, построенных на основе Amazon EC2. Есть ли другие имена, которые я должен добавить? Cloudnumbers Opani crdata...

r machine-learning

36

Хорошие методы для графиков плотности неотрицательных переменных в R?

plot(density(rexp(100)) Очевидно, что вся плотность слева от нуля представляет собой смещение. Я хочу обобщить некоторые данные для статистиков, и я хочу избежать вопросов о том, почему неотрицательные данные имеют плотность слева от нуля. Графики для проверки рандомизации; Я хочу показать...

r pdf gamma-distribution kernel-smoothing

36

Почему знаменатель оценки ковариации не должен быть n-2, а не n-1?

Знаменатель (несмещенной) оценки дисперсии равен поскольку имеется наблюдений и оценивается только один параметр.n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Кроме того, мне интересно, почему...

self-study variance covariance descriptive-statistics unbiased-estimator

36

Как интерпретировать коэффициенты из подгонки полиномиальной модели?

Я пытаюсь создать полином второго порядка, соответствующий некоторым имеющимся у меня данным. Допустим, я заговорю это подходит с ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Я получил: Таким образом, подгонка второго порядка работает...

r regression interpretation regression-coefficients

35

Что хорошего в использовании функции 'comment' в R?

Я только что обнаружил commentфункцию в R. Пример: x <- matrix(1:12, 3,4) comment(x) <- c("This is my very important data from experiment #0234", "Jun 5, 1998") x comment(x) Это первый раз, когда я пришел с этой функцией, и мне было интересно, как часто / полезно ее использовать. Так как в...

r

35

Почему увеличение размера выборки уменьшает дисперсию (выборку)?

Большая фотография: Я пытаюсь понять, как увеличение размера выборки увеличивает мощность эксперимента. Слайды моего лектора объясняют это картиной из 2 нормальных распределений, одно для нулевой гипотезы и одно для альтернативной гипотезы и порога принятия решения c между ними. Они утверждают, что...

variance sampling power

35

Что такое остаточная стандартная ошибка?

При запуске модели множественной регрессии в R один из выходных сигналов представляет собой остаточную стандартную ошибку 0,0589 при 95 161 степени свободы. Я знаю, что 95 161 степень свободы определяется разницей между количеством наблюдений в моей выборке и количеством переменных в моей модели....

regression standard-error residuals

35

Квантильная регрессия: какие стандартные ошибки?

summary.rqФункция от quantreg виньетки предоставляет множество вариантов для стандартных оценок погрешности квантилей коэффициентов регрессии. Каковы специальные сценарии, когда каждый из них становится оптимальным / желательным? «ранг», который дает доверительные интервалы для оцененных параметров...

r standard-error quantile-regression estimators

35

Что такое скорректированная формула R-квадрата в lm в R и как ее следует интерпретировать?

Какая точная формула используется в R lm() для Скорректированного R-квадрата? Как я могу интерпретировать это? Скорректированные R-квадрат формулы Кажется, существует несколько формул для расчета скорректированного R-квадрата. Формула...

r regression r-squared lm shrinkage

35

Линейность PCA

PCA считается линейной процедурой, однако: PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), где . Это означает, что собственные векторы, полученные PCA на матрицах данных , не суммируют до равных...

pca linear