Вопросы с тегом «r»

12

Некоторое время я использовал линейные модели для проведения тестов пропорции 2 образцов, но понял, что это может быть не совсем правильно. Похоже, что использование обобщенной линейной модели с биномиальной связью семейство + тождественность дает в точности результаты пула для 2-выборочной...

r hypothesis-testing generalized-linear-model proportion

12

Доверительные интервалы прогнозов для нелинейной смешанной модели (nlme)

Я хотел бы получить 95% доверительные интервалы на предсказаниях нелинейной смешанной nlmeмодели. Поскольку для этого не предусмотрено ничего стандартного nlme, мне хотелось бы знать, правильно ли использовать метод «интервалов прогнозирования населения», как описано в главе книги Бена Болкера в...

r mixed-model confidence-interval lme4-nlme

12

Бутстрап против Монте-Карло, оценка ошибок

Я читаю статью « Распространение ошибок методом Монте-Карло в геохимических расчетах», Anderson (1976), и есть кое-что, что я не совсем понимаю. Рассмотрим некоторые измеренные данные и программу, которая обрабатывает их и возвращает заданное значение. В статье эта программа используется, чтобы...

bootstrap monte-carlo error

12

Случайная лесная регрессия не предсказывает выше, чем данные обучения

Я заметил, что при построении моделей регрессии случайных лесов, по крайней мере, в R, прогнозируемое значение никогда не превышает максимальное значение целевой переменной, видимое в данных обучения. В качестве примера см. Код ниже. Я строю регрессионную модель для прогнозирования mpgна основе...

r random-forest

12

Bootstrap filter / Алгоритм фильтра частиц (Понимание)

У меня действительно нет понимания того, как работает фильтр начальной загрузки. Я примерно знаю концепции, но не могу понять некоторые детали. Этот вопрос для меня, чтобы прояснить беспорядок. Здесь я буду использовать этот популярный алгоритм фильтрации из ссылки Душе (пока я думаю, что это самая...

particle-filter

12

Теория весового аргумента в R при использовании lm ()

После года, проведенного в аспирантуре, мое понимание «взвешенных наименьших квадратов» таково: пусть , будет некоторой матрицей проектирования, \ boldsymbol \ beta \ in \ mathbb {R} ^ p - вектор параметров, \ boldsymbol \ epsilon \ in \ mathbb {R} ^ n - вектор ошибок, такой что \ boldsymbol \...

r linear-model weighted-regression

12

Как реализовать смешанную модель с использованием функции бетарег в R?

У меня есть набор данных, состоящий из пропорций, которые измеряют «уровень активности» отдельных головастиков, поэтому устанавливаются значения между 0 и 1. Эти данные были собраны путем подсчета количества перемещений человека за определенный промежуток времени (1 для движения, 0 для отсутствия...

r mixed-model random-effects-model beta-distribution beta-regression

12

Что такое многомерные ортогональные полиномы, вычисленные в R?

Ортогональные многочлены в одномерном наборе точек - это многочлены, которые производят значения в этих точках таким образом, что их произведение точек и попарная корреляция равны нулю. R может создавать ортогональные многочлены с функцией poly . Эта же функция имеет вариант polym, который создает...

r multiple-regression polynomial orthogonal

12

Почему lm и biglm в R дают разные значения p для одних и тех же данных?

Вот небольшой пример: MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3)) Теперь с base::lm: > lm(y~x, data=MyDf) %>% summary Call: lm(formula = y ~ x, data = MyDf) Residuals: 1 2 3 4 -0.47 0.41 0.59 -0.53 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.0500 0.8738...

r regression p-value linear-model

12

Метод Нистроема для аппроксимации ядра

Я читал о методе Nyström для апроксимации ядра низкого ранга. Этот метод реализован в scikit-learn [1] как метод проецирования выборок данных в низкосортное приближение отображения характеристик ядра. Насколько мне известно, данный учебный набор и функция ядра, она генерирует низкокачественного...

scikit-learn dimensionality-reduction kernel-trick nonlinear

12

Есть ли серьезная проблема с отбрасыванием наблюдений с пропущенными значениями при расчете матрицы корреляции?

У меня есть этот огромный набор данных с примерно 2500 переменными и примерно 142 наблюдениями. Я хочу запустить корреляцию между переменной X и остальными переменными. Но для многих столбцов пропущены записи. Я попытался сделать это в R, используя аргумент "pairple-complete" (...

r correlation missing-data correlation-matrix

12

График QQ выглядит нормально, но тест Шапиро-Вилка говорит об обратном

В R у меня есть выборка из 348 мер, и я хочу знать, могу ли я предположить, что она обычно распространяется для будущих тестов. По сути, следуя другому ответу из стека , я смотрю на график плотности и график QQ: plot(density(Clinical$cancer_age))...

r normal-distribution

12

Как использовать фильтр Калмана?

У меня есть траектория объекта в 2D-пространстве (поверхности). Траектория задается в виде последовательности (x,y)координат. Я знаю, что мои измерения шумят, и иногда у меня есть очевидные выбросы. Итак, я хочу отфильтровать свои наблюдения. Насколько я понял фильтр Калмана, он делает именно то,...

python kalman-filter smoothing

12

Является ли линейная регрессия устаревшей? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 2 года назад . Сейчас я учусь в классе линейной регрессии, но я не могу избавиться от...

regression machine-learning linear teaching

12

Обобщенные аддитивные модели (GAM), взаимодействия и ковариаты

Я исследовал ряд инструментов для прогнозирования и обнаружил, что Обобщенные аддитивные модели (GAM) обладают наибольшим потенциалом для этой цели. ГАМ - это здорово! Они позволяют указывать сложные модели очень кратко. Однако та же краткость вызывает у меня некоторую путаницу, особенно в...

r modeling gam mgcv

12

Как запрограммировать симуляцию Монте-Карло парадокса Бертрана?

Следующая проблема была размещена на Mensa International на странице Facebook: \quad\quad\quad\quad\quad\quad\quad\quad Само сообщение получило более 1000 комментариев, но я не буду вдаваться в подробности о дебатах, поскольку знаю, что это парадокс Бертранда и ответ . Что меня здесь интересует,...

r probability simulation monte-carlo paradox

12

Как строго обосновать выбранные коэффициенты ложноположительных / ложноотрицательных ошибок и базовое соотношение затрат?

контекст Группа социологов и статистиков ( Benjamin et al., 2017 ) недавно предположила, что типичный ложноположительный показатель ( = .05), используемый в качестве порога для определения «статистической значимости», должен быть скорректирован до более консервативного порога. ( = .005)....

hypothesis-testing p-value power type-i-and-ii-errors

12

Является ли мета-анализ отношений шансов по сути безнадежным?

В недавней работе Norton et al. (2018) утверждают, что[ 1 ][1]^{[1]} Разные отношения шансов из одного и того же исследования нельзя сравнивать, когда статистические модели, которые приводят к оценкам отношения шансов, имеют разные объясняющие переменные, поскольку каждая модель имеет свой...

r logistic meta-analysis odds-ratio adjustment

12

В байесовском умозаключении почему некоторые термины исключены из апостериорного предиктивного?

В сопряженном байесовском анализе гауссовского распределения Кевина Мерфи он пишет, что апостериорное предиктивное распределение p(x∣D)=∫p(x∣θ)p(θ∣D)dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta где DDD - данные, к которым подходит модель, а xxx - невидимые...

bayesian predictive-models inference posterior

12

Беспристрастная оценка экспоненты меры множества?

Предположим, что у нас есть (измеримое и соответственно хорошо себя ведущее) множество , где компактно. Кроме того, предположим, что мы можем извлечь образцы из равномерного распределения по относительно меры Лебега и что мы знаем меру . Например, возможно представляет собой коробку , содержащий...

probability monte-carlo unbiased-estimator measure-theory