Вопросы с тегом «r»

12
Использование lm для 2-пробы

Некоторое время я использовал линейные модели для проведения тестов пропорции 2 образцов, но понял, что это может быть не совсем правильно. Похоже, что использование обобщенной линейной модели с биномиальной связью семейство + тождественность дает в точности результаты пула для 2-выборочной...

12
Доверительные интервалы прогнозов для нелинейной смешанной модели (nlme)

Я хотел бы получить 95% доверительные интервалы на предсказаниях нелинейной смешанной nlmeмодели. Поскольку для этого не предусмотрено ничего стандартного nlme, мне хотелось бы знать, правильно ли использовать метод «интервалов прогнозирования населения», как описано в главе книги Бена Болкера в...

12
Бутстрап против Монте-Карло, оценка ошибок

Я читаю статью « Распространение ошибок методом Монте-Карло в геохимических расчетах», Anderson (1976), и есть кое-что, что я не совсем понимаю. Рассмотрим некоторые измеренные данные и программу, которая обрабатывает их и возвращает заданное значение. В статье эта программа используется, чтобы...

12
Случайная лесная регрессия не предсказывает выше, чем данные обучения

Я заметил, что при построении моделей регрессии случайных лесов, по крайней мере, в R, прогнозируемое значение никогда не превышает максимальное значение целевой переменной, видимое в данных обучения. В качестве примера см. Код ниже. Я строю регрессионную модель для прогнозирования mpgна основе...

12
Bootstrap filter / Алгоритм фильтра частиц (Понимание)

У меня действительно нет понимания того, как работает фильтр начальной загрузки. Я примерно знаю концепции, но не могу понять некоторые детали. Этот вопрос для меня, чтобы прояснить беспорядок. Здесь я буду использовать этот популярный алгоритм фильтрации из ссылки Душе (пока я думаю, что это самая...

12
Теория весового аргумента в R при использовании lm ()

После года, проведенного в аспирантуре, мое понимание «взвешенных наименьших квадратов» таково: пусть , будет некоторой матрицей проектирования, \ boldsymbol \ beta \ in \ mathbb {R} ^ p - вектор параметров, \ boldsymbol \ epsilon \ in \ mathbb {R} ^ n - вектор ошибок, такой что \ boldsymbol \...

12
Как реализовать смешанную модель с использованием функции бетарег в R?

У меня есть набор данных, состоящий из пропорций, которые измеряют «уровень активности» отдельных головастиков, поэтому устанавливаются значения между 0 и 1. Эти данные были собраны путем подсчета количества перемещений человека за определенный промежуток времени (1 для движения, 0 для отсутствия...

12
Что такое многомерные ортогональные полиномы, вычисленные в R?

Ортогональные многочлены в одномерном наборе точек - это многочлены, которые производят значения в этих точках таким образом, что их произведение точек и попарная корреляция равны нулю. R может создавать ортогональные многочлены с функцией poly . Эта же функция имеет вариант polym, который создает...

12
Метод Нистроема для аппроксимации ядра

Я читал о методе Nyström для апроксимации ядра низкого ранга. Этот метод реализован в scikit-learn [1] как метод проецирования выборок данных в низкосортное приближение отображения характеристик ядра. Насколько мне известно, данный учебный набор и функция ядра, она генерирует низкокачественного...

12
Есть ли серьезная проблема с отбрасыванием наблюдений с пропущенными значениями при расчете матрицы корреляции?

У меня есть этот огромный набор данных с примерно 2500 переменными и примерно 142 наблюдениями. Я хочу запустить корреляцию между переменной X и остальными переменными. Но для многих столбцов пропущены записи. Я попытался сделать это в R, используя аргумент "pairple-complete" (...

12
График QQ выглядит нормально, но тест Шапиро-Вилка говорит об обратном

В R у меня есть выборка из 348 мер, и я хочу знать, могу ли я предположить, что она обычно распространяется для будущих тестов. По сути, следуя другому ответу из стека , я смотрю на график плотности и график QQ: plot(density(Clinical$cancer_age))...

12
Как использовать фильтр Калмана?

У меня есть траектория объекта в 2D-пространстве (поверхности). Траектория задается в виде последовательности (x,y)координат. Я знаю, что мои измерения шумят, и иногда у меня есть очевидные выбросы. Итак, я хочу отфильтровать свои наблюдения. Насколько я понял фильтр Калмана, он делает именно то,...

12
Является ли линейная регрессия устаревшей? [закрыто]

Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 2 года назад . Сейчас я учусь в классе линейной регрессии, но я не могу избавиться от...

12
Обобщенные аддитивные модели (GAM), взаимодействия и ковариаты

Я исследовал ряд инструментов для прогнозирования и обнаружил, что Обобщенные аддитивные модели (GAM) обладают наибольшим потенциалом для этой цели. ГАМ - это здорово! Они позволяют указывать сложные модели очень кратко. Однако та же краткость вызывает у меня некоторую путаницу, особенно в...

12
Как запрограммировать симуляцию Монте-Карло парадокса Бертрана?

Следующая проблема была размещена на Mensa International на странице Facebook: \quad\quad\quad\quad\quad\quad\quad\quad Само сообщение получило более 1000 комментариев, но я не буду вдаваться в подробности о дебатах, поскольку знаю, что это парадокс Бертранда и ответ . Что меня здесь интересует,...

12
Как строго обосновать выбранные коэффициенты ложноположительных / ложноотрицательных ошибок и базовое соотношение затрат?

контекст Группа социологов и статистиков ( Benjamin et al., 2017 ) недавно предположила, что типичный ложноположительный показатель ( = .05), используемый в качестве порога для определения «статистической значимости», должен быть скорректирован до более консервативного порога. ( = .005)....

12
Является ли мета-анализ отношений шансов по сути безнадежным?

В недавней работе Norton et al. (2018) утверждают, что[ 1 ][1]^{[1]} Разные отношения шансов из одного и того же исследования нельзя сравнивать, когда статистические модели, которые приводят к оценкам отношения шансов, имеют разные объясняющие переменные, поскольку каждая модель имеет свой...

12
В байесовском умозаключении почему некоторые термины исключены из апостериорного предиктивного?

В сопряженном байесовском анализе гауссовского распределения Кевина Мерфи он пишет, что апостериорное предиктивное распределение p(x∣D)=∫p(x∣θ)p(θ∣D)dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta где DDD - данные, к которым подходит модель, а xxx - невидимые...

12
Беспристрастная оценка экспоненты меры множества?

Предположим, что у нас есть (измеримое и соответственно хорошо себя ведущее) множество , где компактно. Кроме того, предположим, что мы можем извлечь образцы из равномерного распределения по относительно меры Лебега и что мы знаем меру . Например, возможно представляет собой коробку , содержащий...