Вопросы с тегом «r»

19
Почему Пирсон параметрический, а Спирмен непараметрический

По-видимому, коэффициент корреляции Пирсона параметрический, а число Спирмена непараметрическое. У меня проблемы с пониманием этого. Насколько я понимаю, Пирсон вычисляется как и вычисляется таким же образом, за исключением того, что мы подставляем все значения в их ранги.рх у= c o v ( X,...

19
Лучший способ справиться с гетероскедастичностью?

У меня есть график остаточных значений линейной модели в зависимости от подогнанных значений, где гетероскедастичность очень ясна. Однако я не уверен, как мне поступить сейчас, потому что, насколько я понимаю, эта гетероскедастичность делает мою линейную модель недействительной. (Это правильно?)...

19
Юлия: Подводя итоги, как дела

Этот пост относится к быстро меняющемуся событию. Я столкнулся с вопросом 2012 года, в котором было очень хорошее обсуждение Джулии как альтернативы R / Python для различных типов статистических работ. Здесь лежит оригинальный вопрос 2012 года об обещании Юлии К сожалению, тогда Юлия была очень...

19
Смещение логистической регрессии редких событий: как смоделировать недооцененные p с минимальным примером?

У CrossValidated есть несколько вопросов о том, когда и как применять коррекцию смещения редкого события, разработанную King and Zeng (2001) . Я ищу что-то другое: минимальную демонстрацию, основанную на симуляции, которая существует. В частности, король и дзенг «... в данных по редким событиям...

19
Методология прогнозирования VAR

Я строю модель VAR для прогнозирования цены актива и хотел бы знать, является ли мой метод статистически обоснованным, актуальны ли тесты, которые я включил, и нужно ли больше для обеспечения надежного прогноза на основе моих входных переменных. Ниже приведен мой текущий процесс проверки...

19
Что в названии: гиперпараметры

Таким образом, в нормальном распределении у нас есть два параметра: среднее значение и дисперсия . В книге « Распознавание образов и машинное обучение» внезапно появляется гиперпараметр в терминах регуляризации функции ошибок.μμ\muσ2σ2\sigma^2λλ\lambda Какие гиперпараметры? Почему они названы...

19
Является ли пень решения линейной моделью?

Пень решений - это дерево решений с одним разделением. Его также можно записать как кусочную функцию. Например, предположим, что xxx является вектором, а x1x1x_1 является первым компонентом xxx , в настройке регрессии может быть принят некоторый пень решения...

19
Является ли настройка гиперпараметра на образце набора данных плохой идеей?

У меня есть набор данных из 140000 примеров и 30 функций, для которых я готовлю несколько классификаторов для двоичной классификации (SVM, логистическая регрессия, случайный лес и т. Д.) Во многих случаях настройка гиперпараметра для всего набора данных с использованием поиска по сетке или...

19
Непараметрический тест, если два образца взяты из одного распределения

Я хотел бы проверить гипотезу о том, что две выборки взяты из одной и той же совокупности, не делая никаких предположений о распределении выборок или совокупности. Как мне это сделать? Из Википедии у меня сложилось впечатление, что U-критерий Манна-Уитни должен быть подходящим, но на практике он...

19
Почему необходимо выбирать из апостериорного распределения, если мы уже ЗНАЕМ апостериорное распределение?

Насколько я понимаю, при использовании байесовского подхода для оценки значений параметров: Апостериорное распределение представляет собой комбинацию предшествующего распределения и распределения правдоподобия. Мы моделируем это, генерируя выборку из апостериорного распределения (например,...

18
Как я могу оценить стандартные ошибки коэффициента при использовании регрессии гребня?

Я использую гребень регрессии на сильно мультиколлинеарных данных. Используя OLS, я получаю большие стандартные ошибки по коэффициентам из-за мультиколлинеарности. Я знаю, что регрессия гребня является способом решения этой проблемы, но во всех реализациях регрессии гребня, на которые я смотрел,...

18
Правильно ли я рассчитал эти вероятностные отношения?

Я являюсь автором пакета ez для R, и я работаю над обновлением для включения автоматического вычисления отношений правдоподобия (LR) в выходные данные ANOVA. Идея состоит в том, чтобы предоставить LR для каждого эффекта, аналогичного тесту того эффекта, которого достигает ANOVA. Например, LR для...

18
Как сравнивается сила логистической регрессии и t-критерия?

Является ли сила логистической регрессии и критерий Стьюдента эквивалентной? Если это так, то они должны быть «эквивалентными плотности данных», под которыми я подразумеваю, что одно и то же количество базовых наблюдений дает одинаковую мощность при фиксированной альфа-коэффициенте 0,05. Рассмотрим...

18
Использование lmer для прогноза

Здравствуйте, у меня есть две проблемы, которые звучат как естественные кандидаты для многоуровневых / смешанных моделей, которые я никогда не использовал. Более простой и тот, который я надеюсь попробовать в качестве введения, заключается в следующем: данные выглядят как множество строк в форме x...

18
Удаление границ на графиках R для достижения оси Tufte

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Рассмотрим следующий график: x <- 1:100 y1 <- rnorm(100) y2 <- rnorm(100)+100 par(mar=c(5,5,5,5))...

18
Ресурсы для пользователя R, который должен изучить SAS

Я использую R. Каждый день. Я думаю, с точки зрения data.frames, семейства функций apply (), объектно-ориентированного программирования, векторизации и геометрии / эстетики ggplot2. Я только начал работать в организации, которая в основном использует SAS. Я знаю, что есть книга об изучении R для...

18
Построение спарклайнов в R

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я хотел бы использовать R, чтобы построить что-то вроде этого: Казалось бы, возможно, но очень сложно отслеживать...

18
Получение формулы для пределов прогнозирования в линейной модели (т. Е. Интервалы прогнозирования)

Давайте возьмем следующий пример: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) Это создает модель y на основе x1 и x2, используя регрессию OLS. Если мы хотим предсказать y для данного x_vec, мы можем просто использовать формулу,...

18
Совместные пакеты для R

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Не могли бы вы порекомендовать простой в использовании или комплексный пакет совместного анализа для...

18
R пакет для моделирования многоуровневых структурных уравнений?

Я хочу протестировать многоступенчатую модель пути (например, A прогнозирует B, B прогнозирует C, C прогнозирует D), где все мои переменные представляют собой отдельные наблюдения, вложенные в группы. До сих пор я делал это с помощью множественного уникального многоуровневого анализа в R. Я бы...