Вопросы с тегом «r»

25
Каковы преимущества метрики Вассерштейна по сравнению с дивергенцией Кульбака-Лейблера?

В чем практическая разница между метрикой Вассерштейна и дивергенцией Кульбака-Лейблера ? Метрика Вассерштейна также называется расстоянием перемещения Земли . Из Википедии: Метрика Вассерштейна (или Вазерштейна) - это функция расстояния, определяемая между вероятностными распределениями в данном...

25
Является ли «модель препятствий» действительно одной моделью? Или только две отдельные, последовательные модели?

Рассмотрим модель препятствий, прогнозирующую данные подсчета yот обычного предиктора x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 В этом случае у меня есть данные...

25
Имеют ли значения ошибки на вероятностях какое-либо значение?

Люди часто говорят, что какое-то событие имеет шанс 50-60%. Иногда я даже вижу, как люди дают явные полосы ошибок при назначении вероятностей. Имеют ли эти утверждения какое-либо значение или они представляют собой просто лингвистическую причину дискомфорта, выбирая конкретное число для чего-то,...

24
Проверка работоспособности: насколько низким может быть значение p?

Я использую тест ranksum для сравнения медианы двух образцов ( ) и обнаружили , что они значительно отличаются с: . Должен ли я с подозрением относиться к такому маленькому значению или мне следует отнести его к высокой статистической мощности, связанной с наличием очень большой выборки? Есть ли...

24
Post hoc тест после ANOVA с повторными измерениями с использованием R

Я выполнил повторные измерения ANOVA в R следующим образом: aov_velocity = aov(Velocity ~ Material + Error(Subject/(Material)), data=scrd) summary(aov_velocity) Какой синтаксис в R можно использовать для выполнения пост-специального теста после ANOVA с повторными измерениями? Подойдет ли тест Тьюки...

24
Почему lme и aov возвращают разные результаты для повторных измерений ANOVA в R?

Я пытаюсь перейти от использования ezпакета lmeдля повторных измерений ANOVA (как я надеюсь, я смогу использовать пользовательские контрасты с lme). Следуя совету из этого поста в блоге, я смог настроить одну и ту же модель, используя обе функции aov(как это делается ezпри запросе) и lme. Однако, в...

24
Как сделать логистическую регрессию в R, когда результат является дробным (отношение двух отсчетов)?

Я рецензирую статью, в которой есть следующий биологический эксперимент. Устройство используется, чтобы подвергать клетки различным величинам напряжения сдвига жидкости. По мере того как к клеткам прикладывается большее напряжение сдвига, большее их количество начинает отрываться от субстрата. На...

24
Как визуализировать огромную разреженную таблицу непредвиденных обстоятельств?

У меня есть две переменные: название лекарственного средства (DN) и соответствующие нежелательные явления (AE), которые находятся в отношении многих ко многим. Есть 33 556 наименований лекарств и 9 516 побочных эффектов. Размер выборки составляет около 5,8 миллиона наблюдений. Я хочу изучить и...

24
Как спроектировать и реализовать асимметричную функцию потерь для регрессии?

проблема В регрессии обычно вычисляют среднеквадратическую ошибку (MSE) для выборки: MSE=1n∑i=1n(g(xi)−gˆ(xi))2MSE=1n∑i=1n(g(xi)−g^(xi))2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n\left(g(x_i) - \widehat{g}(x_i)\right)^2 для измерения качества предсказателя. Сейчас я работаю над проблемой регрессии,...

24
Колмогоров-Смирнов с дискретными данными: Как правильно использовать dgof :: ks.test в R?

Вопросы для начинающих: Я хочу проверить, поступают ли два дискретных набора данных из одного распределения. Мне предложили пробу Колмогорова-Смирнова. Коновер ( Практическая непараметрическая статистика , 3d), кажется, говорит, что для этой цели можно использовать тест Колмогорова-Смирнова, но его...

24
Как определить квантили (изолинии?) Многомерного нормального распределения

Меня интересует, как можно рассчитать квантиль многомерного распределения. На рисунках я нарисовал квантили 5% и 95% данного одномерного нормального распределения (слева). Для правильного многомерного нормального распределения я представляю, что аналогом будет изолиния, которая окружает основу...

24
Какова подходящая модель для данных недостаточного рассеяния?

Я пытаюсь смоделировать данные подсчета в R, которые, по-видимому, недостаточно распределены (параметр дисперсии ~ .40). Вероятно, поэтому модель glmс family = poissonили отрицательной биномиальной ( glm.nb) не имеет значения. Когда я смотрю на описания моих данных, у меня нет типичной асимметрии...

24
Байесовское лассо против обычного лассо

Различное программное обеспечение реализации доступно для лассо . Я знаю, что много обсуждали байесовский подход против частого подхода на разных форумах. Мой вопрос очень специфичен для лассо - каковы различия или преимущества ласио Байса против обычного лассо ? Вот два примера реализации в...

24
Что такое «псевдонимы»?

При построении регрессионной модели в R ( lm) я часто получаю это сообщение "there are aliased coefficients in the model" Что именно это значит? Кроме того, из-за этого predict()также дает предупреждение. Хотя это всего лишь предупреждение, я хочу знать, как мы можем обнаружить / удалить псевдонимы...

24
Алгоритмы обнаружения аномалий временных рядов

В настоящее время я использую AnomalyDetection от Twitter в R: https://github.com/twitter/AnomalyDetection . Этот алгоритм обеспечивает обнаружение аномалий временных рядов для данных с сезонностью. Вопрос: есть ли другие алгоритмы, подобные этому (контроль сезонности не имеет значения)? Я пытаюсь...

24
Является ли этот метод подходящим для проверки сезонных эффектов в данных о количестве самоубийств?

У меня есть 17 лет (с 1995 по 2011) данных свидетельств о смерти, связанных со смертями от самоубийств для штата в США. Существует много мифологий о самоубийствах и месяцах / сезонах, большая часть которых противоречива, и литературы, которую я ' После проверки я не получил четкого представления о...

24
Оценка логистической регрессии и интерпретации Хосмера-Лемешоу Goodness of Fit

Как мы все знаем, есть 2 метода для оценки модели логистической регрессии, и они тестируют очень разные вещи Прогнозирующая сила: Получите статистику, которая измеряет, насколько хорошо вы можете предсказать зависимую переменную на основе независимых переменных. Хорошо известными псевдо R ^ 2...

24
Переключиться с моделирования процесса с использованием распределения Пуассона, чтобы использовать отрицательное биномиальное распределение?

\newcommand{\P}{\mathbb{P}} Мы имеем случайный процесс , который может или может-не-происходить несколько раз в течение заданного периода времени TTT . У нас есть поток данных из уже существующей модели этого процесса, который обеспечивает вероятность ряда событий, происходящих в период...

24
По какой причине Adam Optimizer считается устойчивым к значению своих гиперпараметров?

Я читал об оптимизаторе Адама для Deep Learning и натолкнулся на следующее предложение в новой книге « Deep Learning » Бенджо, Гудфеллоу и Курвилля: Адам, как правило, считается достаточно устойчивым к выбору гиперпараметров, хотя скорость обучения иногда необходимо изменить по сравнению с...