Вопросы с тегом «r»

11
Оптимальное биннинг по отношению к заданной переменной отклика

Я ищу оптимальный метод биннинга (дискретизации) непрерывной переменной по отношению к заданной ответной (целевой) двоичной переменной и с максимальным количеством интервалов в качестве параметра. пример: у меня есть набор наблюдений за людьми с переменными "высота" (цифра непрерывная) и...

11
Разделить данные на N равных групп

У меня есть датафрейм, который содержит значения в 4 столбцах: Например: ID, price, click count,rating Я хотел бы «разбить» этот фрейм данных на N разных групп, где каждая группа будет иметь одинаковое количество строк с одинаковым распределением цены, количества кликов и атрибутов рейтингов. Любой...

11
Почему Ограниченная максимальная вероятность дает лучшую (непредвзятую) оценку дисперсии?

Я читаю теоретическую статью Дуга Бейтса о пакете lme4 в R, чтобы лучше понять суть смешанных моделей, и натолкнулся на интригующий результат, который я хотел бы лучше понять, об использовании ограниченного максимального правдоподобия (REML) для оценки дисперсии , В разделе 3.3, посвященном...

11
Смещенная начальная загрузка: можно ли центрировать КИ вокруг наблюдаемой статистики?

Это похоже на Bootstrap: оценка находится вне доверительного интервала У меня есть некоторые данные, которые представляют количество генотипов в популяции. Я хочу оценить генетическое разнообразие, используя индекс Шеннона, а также создать доверительный интервал с помощью начальной загрузки. Я...

11
Проклятие размерности: классификатор кНН

Я читаю книгу Кевина Мерфи: Машинное обучение - вероятностная перспектива. В первой главе автор объясняет проклятие размерности, и есть часть, которую я не понимаю. В качестве примера автор заявляет: Рассмотрим входы, равномерно распределенные по D-мерному единичному кубу. Предположим, что мы...

11
Как симулировать цензурированные данные

Мне интересно, как я могу смоделировать выборку из n времен жизни распределения Вейбулла, которые включают наблюдения типа I с правой цензурой. Например, пусть n = 3, shape = 3, scale = 1 и уровень цензуры = .15, а время цензуры = .88. Я знаю, как сгенерировать выборку Вейбулла, но я не знаю, как...

11
Каковы различия между регрессией Риджа с использованием R glmnet и Python scikit-learn?

Я изучаю раздел LAB §6.6, посвященный регрессии Риджа / Лассо, в книге Джеймса Виттена «Hastie», Tibshirani (2013) «Введение в статистическое обучение с приложениями в R» . Более конкретно, я пытаюсь применить модель scikit-learn Ridgeк набору данных 'Hitters' из пакета R 'ISLR'. Я создал такой же...

11
Сколько дистрибутивов в GLM?

Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R. Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример )....

11
Имитация броуновской экскурсии с использованием броуновского моста?

Я хотел бы смоделировать броуновский экскурсионный процесс (обусловленное броуновское движение всегда будет положительным при 0<t<10<t<10 \lt t \lt 1 до 000 при t=1t=1t=1 ). Поскольку броуновский экскурсионный процесс - это броуновский мост, который всегда должен быть положительным, я...

11
Как бороться с «нецелым» предупреждением от отрицательного биномиального GLM?

Я пытаюсь смоделировать среднюю интенсивность паразитов, воздействующих на хозяина в R, используя отрицательную биномиальную модель. Я продолжаю получать 50 или более предупреждений, которые говорят: In dpois(y, mu, log = TRUE) : non-integer x = 251.529000 Как я могу справиться с этим? Мой код...

11
Используют ли статистики предыдущие работы Джеффри в реальной прикладной работе?

Когда я узнал о предшествующей работе Джеффриса в моем классе по статистическому выводу для выпускников, мои профессора сделали его звучащим так, как будто это было интересно в основном по историческим причинам, а не потому, что кто-либо когда-либо использовал его. Затем, когда я взяла байесовский...

11
Каковы «желательные» статистические свойства теста отношения правдоподобия?

Я читаю статью , метод которой полностью основан на тесте отношения правдоподобия. Автор говорит, что тест LR против односторонних альтернатив является UMP. Он продолжает, утверждая, что «... даже если невозможно доказать, что [тест LR] является наиболее мощным, тест LR часто имеет желательные...

11
Какой тест для анализа перекрестных таблиц: Boschloo или Barnard?

Я анализирую таблицу 2х2 из небольшого набора данных из 30 пациентов. Мы ретроспективно пытаемся найти некоторые переменные, которые дают подсказку о том, какое лечение выбрать. Переменные (общепринятые / странные) и решение о лечении (A / B) представляют особый интерес, и поэтому данные выглядят...

11
Понимание бета-конъюгата перед байесовским выводом о частоте

Ниже приведен отрывок из «Болстадского введения в байесовскую статистику» . Для всех вас, экспертов, это может быть тривиально, но я не понимаю, как автор приходит к выводу, что нам не нужно делать какую-либо интеграцию для вычисления апостериорной вероятности для некоторого значения . Я понимаю...

11
Несмещенная оценка для модели AR ( )

Рассмотрим модель AR ( ) (предполагая нулевое среднее значение для простоты):ппp ИксT= φ1Икст - 1+ … + ΦпИкст - р+ εTИксTзнак равноφ1ИксT-1+...+φпИксT-п+εT x_t = \varphi_1 x_{t-1} + \dotsc + \varphi_p x_{t-p} + \varepsilon_t Оценщик OLS (эквивалентный условному максимального правдоподобия) для...

11
Когда нельзя распределить выборку по частоте в байесовской апостериорной системе в условиях регрессии?

Мои актуальные вопросы приведены в двух последних абзацах, но для их мотивации: Если я пытаюсь оценить среднее значение случайной величины, которая следует за нормальным распределением с известной дисперсией, я прочитал, что если поставить перед средним равномерное значение, получится апостериорное...

11
Подгонка биномиального GLMM (glmer) к переменной отклика, которая является пропорцией или долей

Я надеюсь, что кто-то может помочь с тем, что я считаю относительно простым вопросом, и я думаю, что знаю ответ, но без подтверждения он стал тем, в чем я просто не могу быть уверен. У меня есть данные подсчета в качестве переменной ответа, и я хочу измерить, как эта переменная изменяется при...

11
Интерпретация результатов усреднения модели в R

Я пытаюсь понять и знать, что сообщать из моего анализа некоторых данных с использованием усреднения модели по R. Я использую следующий скрипт для анализа влияния метода измерения на данную переменную: Вот набор данных: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0 Модель для установки:...

11
Как интерпретировать результаты модели TBATS и диагностику модели

У меня есть получасовые данные о спросе, которые представляют собой многосезонные временные ряды. Я использовал tbatsв forecastпакете в R, и получил результаты , как это: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) Означает ли это, что ряд не обязательно должен...

11
Должен ли я использовать смещение для моего Poisson GLM?

Я провожу исследование, чтобы посмотреть на различия в плотности и богатстве видов рыб при использовании двух разных методов подводной визуальной переписи. Мои данные изначально были данными подсчета, но затем они обычно меняются на плотность рыбы, но я все же решил использовать Poisson GLM, что, я...