Вопросы с тегом «r»

22
Ограниченные машины Больцмана против многослойных нейронных сетей

Я давно хотел поэкспериментировать с нейронной сетью для решения проблемы классификации, с которой я столкнулся. Я столкнулся с бумагами, которые говорят о УКР. Но из того, что я могу понять, они ничем не отличаются от наличия многослойной нейронной сети. Это точно? Более того, я работаю с R и не...

22
Коррекция смещения во взвешенной дисперсии

Для невзвешенной дисперсии существует дисперсия выборки с поправкой на смещение, когда среднее значение было оценено по тем же данным: Var(X):=1Вар ( Х) : = 1NΣя( хя- μ )2Var(Икс)знак равно1NΣя(Икся-μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Вар ( Х) : = 1n - 1Σя( хя- E[ X] )2Var(Икс)знак...

22
R's randomForest не может обрабатывать более 32 уровней. Что такое обходной путь?

R-пакет randomForest не может обрабатывать фактор с более чем 32 уровнями. Когда ему дается более 32 уровней, выдается сообщение об ошибке: Не может обрабатывать категориальные предикторы с более чем 32 категориями. Но у меня есть несколько факторов. Некоторые из них имеют более 1000 уровней, а...

22
Тест Вальда в регрессии (OLS и GLM): распределение t- и z-распределения

Я понимаю, что критерий Вальда для коэффициентов регрессии основан на следующем свойстве, которое выполняется асимптотически (например, Вассерман (2006): Вся статистика , стр. 153, 214-215): Где обозначает предполагаемый коэффициент регрессии, обозначает стандартную ошибку коэффициента регрессии, а...

22
Регрессия для модели формы

У меня есть набор данных, который является статистикой с форума веб-обсуждения. Я смотрю на распределение количества ответов, которые должна иметь тема. В частности, я создал набор данных, в котором есть список ответов на темы, а затем - количество тем с таким количеством ответов....

22
Как на самом деле работает самозагрузка в R?

Я изучал загрузочный пакет в R, и хотя я нашел несколько хороших учебников по его использованию, мне еще предстоит найти что-то, что точно описывает то, что происходит "за кулисами". Например, в этом примере руководство показывает, как использовать стандартные коэффициенты регрессии в качестве...

22
Вывод статистики W с помощью wilcox.test () в R совпадает со статистикой U?

Я недавно читал о U-тесте Манна-Уитни. Оказывается, что для проведения этого теста в R вам действительно нужно запустить тест Уилкоксона! Мой вопрос: wilcox.testидентична ли статистика W в R статистике...

22
Кластеризация двоичной матрицы

У меня есть полумаленькая матрица двоичных объектов размером 250k x 100. Каждая строка является пользователем, а столбцы представляют собой двоичные «теги» некоторого поведения пользователя, например «likes_cats». user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 C 1 0 0 1 0 Я...

22
Как неправильный априор может привести к правильному заднему распределению?

Мы знаем, что в случае правильного предварительного распределения, P(θ∣X)=P(X∣θ)P(θ)P(X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} ∝P(X∣θ)P(θ)∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta) . Обычное обоснование этого шага состоит в том, что предельное...

22
Почему я получаю нулевую дисперсию случайного эффекта в моей смешанной модели, несмотря на некоторые различия в данных?

Мы запустили логистическую регрессию со смешанными эффектами, используя следующий синтаксис; # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) Предмет и Предмет - случайные эффекты. Мы получаем странный...

22
интерпретация оси Y частичной зависимости графиков

Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 5 лет назад . Я читал другие темы о графиках частичной зависимости, и большинство из них касаются того, как вы на самом деле строите их с помощью разных пакетов, а не того, как...

22
Примеры расширенного регрессионного моделирования

Я ищу расширенное тематическое исследование линейной регрессии, иллюстрирующее шаги, необходимые для моделирования сложных, множественных нелинейных отношений с использованием GLM или OLS. На удивление трудно найти ресурсы, выходящие за рамки базовых школьных примеров: большинство книг, которые я...

22
Shrunken

В моей голове была некоторая путаница в отношении двух типов оценок популяционного значения коэффициента корреляции Пирсона. A. Fisher (1915) показал, что для двумерной нормальной популяции эмпирическое значение является отрицательно смещенной оценкой ρ , хотя смещение может быть практически...

22
Пошаговая линейная алгебраическая вычисление регрессии наименьших квадратов

В качестве приквела к вопросу о линейно-смешанных моделях в R и для использования в качестве справочного материала для любителей статистики начального и среднего уровня, я решил опубликовать в качестве независимого «Q & A-style» шаги, связанные с «ручным» вычислением Коэффициенты и прогнозные...

22
Всегда ли объективный оценщик максимального правдоподобия всегда лучший объективный оценщик?

Я знаю, для обычных задач, если у нас есть лучший регулярный объективный оценщик, это должен быть оценщик максимального правдоподобия (MLE). Но в целом, если у нас есть беспристрастный MLE, будет ли он также лучшим беспристрастным оценщиком (или, может быть, я должен назвать его UMVUE, если он...

22
Сырая или ортогональная полиномиальная регрессия?

Я хочу регрессировать переменную yyy на x,x2,…,x5x,x2,…,x5x,x^2,\ldots,x^5 . Должен ли я сделать это, используя сырые или ортогональные полиномы? Я посмотрел на вопрос на сайте, который касается этих вопросов, но я не совсем понимаю, в чем разница между их использованием. Почему я не могу просто...