Вопросы с тегом «r»

11

R neuralnet - вычислить, дать постоянный ответ

Я пытаюсь использовать neuralnetпакет R (документация здесь ) для прогноза. Вот что я пытаюсь сделать: library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~',...

r neural-networks prediction error

11

Совокупный / Совокупный график (или «Визуализация кривой Лоренца»)

Я не знаю, как называются такие сюжеты, и поэтому я дал этому вопросу глупое название. Допустим, у меня есть заказанный набор данных следующим образом 4253 4262 4270 4383 4394 4476 4635 ... Каждое число соответствует количеству публикаций, которые определенный пользователь внес на сайт. Я...

r distributions data-visualization

11

Как выбрать количество деревьев в обобщенной регрессионной модели?

Есть ли стратегия выбора количества деревьев в GBM? В частности, ntreesаргумент в R«S gbmфункции. Я не понимаю, почему вы не должны устанавливать ntreesмаксимально разумное значение. Я заметил, что большее количество деревьев явно уменьшает изменчивость результатов от нескольких GBM. Я не думаю,...

r machine-learning gbm

11

Как получить объединенные p-значения в тестах, выполненных в нескольких вмененных наборах данных?

Используя Amelia в R, я получил несколько вмененных наборов данных. После этого я выполнил повторный тест в SPSS. Теперь я хочу объединить результаты испытаний. Я знаю, что могу использовать правила Рубина (реализованные через любой пакет множественного вменения в R) для объединения средств и...

r spss p-value multiple-imputation pooling

11

Как работает «ступенчатая регрессия»?

Я использовал следующий код R, чтобы соответствовать пробитной модели: p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1) stepwise(p1, direction='backward/forward', criterion='BIC') Я хочу знать, что делает stepwiseи backward/forwardделает именно и как выбрать...

r probit stepwise-regression

11

Понимание вывода начальной загрузки, выполненной в R (tsboot, MannKendall)

У меня есть вопрос, касающийся интерпретации вызова tsboot в R. Я проверил документацию как Kendall, так и загрузочного пакета, но я не умнее, чем раньше. Когда я запускаю бутстрап, используя, например, пример из пакета Kendall, где статистикой теста является тау Кендалла: library(Kendall) # Annual...

r bootstrap

11

Гиперприорная плотность для иерархической модели Гамма-Пуассона

В иерархической модели данных где на практике типичным является выбор значений ( , что среднее значение и дисперсия гамма-распределения примерно соответствуют среднему значению и дисперсии данных (например, Clayton and Kaldor, 1987 "Эмпирические байесовские оценки стандартизированных по возрасту...

poisson-distribution gamma-distribution hierarchical-bayesian hyperparameter

11

Расстояние между двумя гауссовыми смесями для оценки кластерных решений

Я провожу быстрое моделирование для сравнения различных методов кластеризации, и в настоящее время попадаю в ловушку, пытаясь оценить кластерные решения. Мне известны различные метрики проверки (многие из них содержатся в cluster.stats () в R), но я предполагаю, что они лучше всего используются,...

clustering kullback-leibler gaussian-mixture

11

Результаты регрессии хребта отличаются при использовании lm.ridge и glmnet

Я применил некоторые данные, чтобы найти лучшее решение переменных регрессионной модели с использованием регрессии гребня в R. Я использовал lm.ridgeи glmnet(когда alpha=0), но результаты сильно отличаются, особенно когда lambda=0. Предполагается, что оба оценщика параметров имеют одинаковые...

r regression ridge-regression glmnet

11

Какова интуиция в изменении метрики информации (VI) для проверки кластера?

Для таких статистиков, как я, очень трудно уловить идею VIметрики (вариации информации) даже после прочтения соответствующей статьи Марины Мелиа « Сравнение кластеризаций - расстояние, основанное на информации » (Journal of Multivariate Analysis, 2007). На самом деле, я не знаком со многими...

r clustering validation intuition

11

Как проверить, соответствуют ли мои данные журналу нормального распределения?

Я хотел бы проверить, соответствуют Rли мои данные нормальному логарифму или парето. Как я мог это сделать? Возможно, это ks.testможет помочь мне, но как я могу получить параметры αα\alpha и kkk для распределения Парето для моих...

r regression distributions lognormal pareto-distribution

11

Соотношение двух колод карт?

Я написал программу для имитации сверху вниз перетасовать карты. Каждая карта пронумерована, начиная с масти CLUBS, DIAMONDS, HEARTS, SPADESи ранга от двух до десяти, затем Джек, Королева, Король и Туз. Таким образом, у двух клубов число 1, у трех клубов 2 ... Туз треф составляет 13 ... Туз пик...

correlation pearson-r information-theory

11

Как рассчитать среднее и стандартное отклонение для логнормального распределения, используя 2 процентили

Я пытаюсь вычислить среднее и стандартное отклонение от 2 процентилей для логнормального распределения. Я был успешным в выполнении расчета для нормального распределения с использованием X = mean + sd * Zи решения для среднего и сд. Я думаю, что мне не хватает уравнения, когда я пытаюсь сделать то...

r lognormal

11

Тест отношения правдоподобия и тест Вальда дают разные выводы для glm в R

Я воспроизводлю пример из обобщенных, линейных и смешанных моделей . Мой MWE ниже: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <-...

r logistic generalized-linear-model likelihood-ratio z-test

11

Как исправить один коэффициент и подогнать другие, используя регрессию

Я хотел бы вручную зафиксировать определенный коэффициент, скажем, , затем подогнать коэффициенты ко всем остальным предикторам, сохраняя при этом β 1 = 1,0 в модели.β1=1.0β1=1.0\beta_1=1.0β1=1.0β1=1.0\beta_1=1.0 Как я могу добиться этого с помощью R? Я бы особенно хотел поработать с LASSO (...

r multiple-regression lasso glmnet constrained-regression

11

Можно ли использовать значения масштабирования в линейном дискриминантном анализе (LDA) для построения объясняющих переменных на линейных дискриминантах?

Используя набор значений, полученных в результате анализа главных компонентов, можно изучить объясняющие переменные, составляющие каждый основной компонент. Возможно ли это и с помощью линейного дискриминантного анализа? Приведенные примеры используют данные «Данные Ириса Эдгара Андерсона» (...

r pca multivariate-analysis discriminant-analysis biplot

11

Тест Фридмана против теста Уилкоксона

Я пытаюсь оценить производительность алгоритма классификации машинного обучения под наблюдением. Наблюдения делятся на номинальные классы (2 на данный момент, однако я хотел бы обобщить это для многоклассовых проблем), составленные из 99 субъектов. Один из вопросов, на которые я бы хотел ответить,...

r hypothesis-testing nonparametric

11

Общий метод получения стандартной ошибки

Я не могу найти общий метод для получения стандартных ошибок в любом месте. Я смотрел на Google, этот веб-сайт и даже в учебниках, но все, что я могу найти, - это формула для стандартных ошибок среднего, дисперсии, пропорции, степени риска и т. Д., А не то, как были получены эти формулы. Если бы...

standard-error

11

Подгонка многоуровневых моделей к сложным данным обследования в R

Я ищу совет о том, как анализировать сложные данные опросов с помощью многоуровневых моделей в R. Я использовал этот surveyпакет для взвешивания неравных вероятностей выбора в одноуровневых моделях, но этот пакет не имеет функций для многоуровневого моделирования. lme4Пакет отлично подходит для...

r mixed-model weighted-sampling cluster-sample

11

Параметр нецентральности - что это, что он делает, что было бы предложенным значением?

Я пытался освежить свои знания в области статистики, особенно в отношении определения размера выборки и статистического анализа мощности. Но кажется, что чем больше я читаю, тем больше мне нужно читать. В любом случае я нашел инструмент под названием G * Power, который, кажется, делает все, что мне...

power-analysis power non-central