Вопросы с тегом «r»

11
Совокупный / Совокупный график (или «Визуализация кривой Лоренца»)

Я не знаю, как называются такие сюжеты, и поэтому я дал этому вопросу глупое название. Допустим, у меня есть заказанный набор данных следующим образом 4253 4262 4270 4383 4394 4476 4635 ... Каждое число соответствует количеству публикаций, которые определенный пользователь внес на сайт. Я...

11
Как выбрать количество деревьев в обобщенной регрессионной модели?

Есть ли стратегия выбора количества деревьев в GBM? В частности, ntreesаргумент в R«S gbmфункции. Я не понимаю, почему вы не должны устанавливать ntreesмаксимально разумное значение. Я заметил, что большее количество деревьев явно уменьшает изменчивость результатов от нескольких GBM. Я не думаю,...

11
Как получить объединенные p-значения в тестах, выполненных в нескольких вмененных наборах данных?

Используя Amelia в R, я получил несколько вмененных наборов данных. После этого я выполнил повторный тест в SPSS. Теперь я хочу объединить результаты испытаний. Я знаю, что могу использовать правила Рубина (реализованные через любой пакет множественного вменения в R) для объединения средств и...

11
Понимание вывода начальной загрузки, выполненной в R (tsboot, MannKendall)

У меня есть вопрос, касающийся интерпретации вызова tsboot в R. Я проверил документацию как Kendall, так и загрузочного пакета, но я не умнее, чем раньше. Когда я запускаю бутстрап, используя, например, пример из пакета Kendall, где статистикой теста является тау Кендалла: library(Kendall) # Annual...

11
Гиперприорная плотность для иерархической модели Гамма-Пуассона

В иерархической модели данных где на практике типичным является выбор значений ( , что среднее значение и дисперсия гамма-распределения примерно соответствуют среднему значению и дисперсии данных (например, Clayton and Kaldor, 1987 "Эмпирические байесовские оценки стандартизированных по возрасту...

11
Расстояние между двумя гауссовыми смесями для оценки кластерных решений

Я провожу быстрое моделирование для сравнения различных методов кластеризации, и в настоящее время попадаю в ловушку, пытаясь оценить кластерные решения. Мне известны различные метрики проверки (многие из них содержатся в cluster.stats () в R), но я предполагаю, что они лучше всего используются,...

11
Результаты регрессии хребта отличаются при использовании lm.ridge и glmnet

Я применил некоторые данные, чтобы найти лучшее решение переменных регрессионной модели с использованием регрессии гребня в R. Я использовал lm.ridgeи glmnet(когда alpha=0), но результаты сильно отличаются, особенно когда lambda=0. Предполагается, что оба оценщика параметров имеют одинаковые...

11
Какова интуиция в изменении метрики информации (VI) для проверки кластера?

Для таких статистиков, как я, очень трудно уловить идею VIметрики (вариации информации) даже после прочтения соответствующей статьи Марины Мелиа « Сравнение кластеризаций - расстояние, основанное на информации » (Journal of Multivariate Analysis, 2007). На самом деле, я не знаком со многими...

11
Как проверить, соответствуют ли мои данные журналу нормального распределения?

Я хотел бы проверить, соответствуют Rли мои данные нормальному логарифму или парето. Как я мог это сделать? Возможно, это ks.testможет помочь мне, но как я могу получить параметры αα\alpha и kkk для распределения Парето для моих...

11
Соотношение двух колод карт?

Я написал программу для имитации сверху вниз перетасовать карты. Каждая карта пронумерована, начиная с масти CLUBS, DIAMONDS, HEARTS, SPADESи ранга от двух до десяти, затем Джек, Королева, Король и Туз. Таким образом, у двух клубов число 1, у трех клубов 2 ... Туз треф составляет 13 ... Туз пик...

11
Как рассчитать среднее и стандартное отклонение для логнормального распределения, используя 2 процентили

Я пытаюсь вычислить среднее и стандартное отклонение от 2 процентилей для логнормального распределения. Я был успешным в выполнении расчета для нормального распределения с использованием X = mean + sd * Zи решения для среднего и сд. Я думаю, что мне не хватает уравнения, когда я пытаюсь сделать то...

11
Тест отношения правдоподобия и тест Вальда дают разные выводы для glm в R

Я воспроизводлю пример из обобщенных, линейных и смешанных моделей . Мой MWE ниже: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <-...

11
Как исправить один коэффициент и подогнать другие, используя регрессию

Я хотел бы вручную зафиксировать определенный коэффициент, скажем, , затем подогнать коэффициенты ко всем остальным предикторам, сохраняя при этом β 1 = 1,0 в модели.β1=1.0β1=1.0\beta_1=1.0β1=1.0β1=1.0\beta_1=1.0 Как я могу добиться этого с помощью R? Я бы особенно хотел поработать с LASSO (...

11
Можно ли использовать значения масштабирования в линейном дискриминантном анализе (LDA) для построения объясняющих переменных на линейных дискриминантах?

Используя набор значений, полученных в результате анализа главных компонентов, можно изучить объясняющие переменные, составляющие каждый основной компонент. Возможно ли это и с помощью линейного дискриминантного анализа? Приведенные примеры используют данные «Данные Ириса Эдгара Андерсона» (...

11
Тест Фридмана против теста Уилкоксона

Я пытаюсь оценить производительность алгоритма классификации машинного обучения под наблюдением. Наблюдения делятся на номинальные классы (2 на данный момент, однако я хотел бы обобщить это для многоклассовых проблем), составленные из 99 субъектов. Один из вопросов, на которые я бы хотел ответить,...

11
Общий метод получения стандартной ошибки

Я не могу найти общий метод для получения стандартных ошибок в любом месте. Я смотрел на Google, этот веб-сайт и даже в учебниках, но все, что я могу найти, - это формула для стандартных ошибок среднего, дисперсии, пропорции, степени риска и т. Д., А не то, как были получены эти формулы. Если бы...

11
Подгонка многоуровневых моделей к сложным данным обследования в R

Я ищу совет о том, как анализировать сложные данные опросов с помощью многоуровневых моделей в R. Я использовал этот surveyпакет для взвешивания неравных вероятностей выбора в одноуровневых моделях, но этот пакет не имеет функций для многоуровневого моделирования. lme4Пакет отлично подходит для...

11
Параметр нецентральности - что это, что он делает, что было бы предложенным значением?

Я пытался освежить свои знания в области статистики, особенно в отношении определения размера выборки и статистического анализа мощности. Но кажется, что чем больше я читаю, тем больше мне нужно читать. В любом случае я нашел инструмент под названием G * Power, который, кажется, делает все, что мне...