Вопросы с тегом «r»

30
Интерпретация болтов в анализе главных компонентов

Я наткнулся на этот хороший учебник: Руководство по статистическому анализу с использованием R. Глава 13. Анализ основных компонентов: Олимпийский гепатлон о том, как делать PCA на языке R. Я не понимаю интерпретацию рисунка 13.3: Итак, я строю первый собственный вектор против второго собственного...

30
Зачем использовать векторную модель коррекции ошибок?

Меня смущает модель коррекции ошибок вектора ( VECM ). Техническая справка: VECM предлагает возможность применять векторную авторегрессионную модель ( VAR ) к интегрированным многомерным временным рядам. В учебниках они называют некоторые проблемы в применении VAR к интегрированным временным рядам,...

30
Как центрирование влияет на PCA (для SVD и собственного разложения)?

Какое значение имеет центрирование (или де-смысл) ваших данных для PCA? Я слышал, что это облегчает математику или препятствует доминированию переменных на первом компьютере, но я чувствую, что пока не смог твердо понять концепцию. Например, главный ответ здесь. Как центрирование данных избавляет...

30
Почему бы не сообщить о значении дистрибутива начальной загрузки?

Когда кто-то загружает параметр, чтобы получить стандартную ошибку, мы получаем распределение параметра. Почему мы не используем среднее значение этого распределения в качестве результата или оценки для параметра, который мы пытаемся получить? Разве распределение не должно приближаться к реальному?...

30
Как выполнить уменьшение размерности с PCA в R

У меня большой набор данных, и я хочу уменьшить размерность. Сейчас везде читаю, что могу использовать для этого PCA. Тем не менее, я все еще не понимаю, что делать после вычисления / выполнения PCA. В R это легко сделать с помощью команды princomp. Но что делать после расчета СПС? Если я решил,...

30
Что такое квазибиномиальное распределение (в контексте GLM)?

Я надеюсь, что кто-то может дать интуитивный обзор того, что такое квазибиномиальное распределение и что оно делает. Меня особенно интересуют эти моменты: Чем квазибиномиал отличается от биномиального распределения. Когда переменная отклика представляет собой пропорцию (примерные значения включают...

30
Тест на бимодальное распределение

Интересно, существует ли какой-либо статистический тест для «проверки» значимости бимодального распределения. Я имею в виду, насколько мои данные соответствуют бимодальному распределению или нет? Если да, есть ли тест в программе...

30
Как узнать, является ли временной ряд стационарным или нестационарным?

Я использую R, я искал на Google и выяснил , что kpss.test(), PP.test()и adf.test()используются , чтобы знать о стационарности временных рядов. Но я не статистика, которая может интерпретировать свои результаты > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649,...

30
Кто первым использовал / изобрел p-значения?

Я пытаюсь написать серию постов в блоге о p-значениях, и я подумал, что было бы интересно вернуться к тому, с чего все началось, - похоже, это статья Пирсона 1900 года. Если вы знакомы с этим документом, вы помните, что он охватывает тестирование на пригодность. Пирсон немного болтает со своим...

30
В чем разница между тестом Макнемара и тестом хи-квадрат, и как вы знаете, когда их использовать?

Я пытался читать из разных источников, но мне все еще не ясно, какой тест будет уместным в моем случае. Есть три разных вопроса о моем наборе данных: Испытуемые проверяются на инфекции от X в разное время. Я хочу знать, связана ли доля положительного для X после доли с положительным для X до: After...

30
Какая разница инфляции фактор я должен использовать:

Я пытаюсь интерпретировать дисперсии коэффициентов инфляции с использованием vifфункции в пакете R car. Функция печатает как обобщенный и . Согласно файлу справки , это последнее значениеVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Чтобы настроить размер доверительного...

30
Сравнение Lme и Lmer

Мне было интересно, сможет ли кто-нибудь рассказать мне о текущих различиях между этими двумя функциями. Я нашел следующий вопрос: Как выбрать библиотеку nlme или lme4 R для моделей со смешанными эффектами? , но это происходит пару лет назад. Это жизнь в кругах программного обеспечения. Мои...

30
Что означает глубина взаимодействия в GBM?

У меня был вопрос о параметре глубины взаимодействия в gbm в R. Это может быть вопрос noob, за который я прошу прощения, но как параметр, который, я считаю, обозначает количество терминальных узлов в дереве, в основном указывает X-way взаимодействие между предикторами? Просто пытаюсь понять, как...

30
Какой хороший способ использовать R для создания диаграммы рассеяния, которая разделяет данные по обработке?

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я очень плохо знаком с R и статистикой в ​​целом, но мне нужно составить график рассеяния, который, я думаю, может быть...

30
Насколько хорошо R масштабируется для текстовых задач классификации? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыт 10 месяцев назад . Я пытаюсь ускорить работу с R. Я в конечном итоге хочу использовать библиотеки R для классификации...

30
Что делает команда anova () с объектом модели lmer?

Надеюсь, что это вопрос, который кто-то здесь может ответить для меня о природе разложения сумм квадратов из модели смешанных эффектов lmer(из пакета lme4 R). Прежде всего я должен сказать, что мне известно о противоречиях с использованием этого подхода, и на практике я бы с большей вероятностью...

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

29
Пакеты R для выполнения тематического моделирования / LDA: просто `topicmodels` и` lda` [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Мне кажется, что только два пакета R способны выполнять скрытое выделение Дирихле : Один из них lda,...

29
Как выполнить ортогональную регрессию (наименьших квадратов) с помощью PCA?

Я всегда использую lm()в R для выполнения линейной регрессии yyy на xxx . Эта функция возвращает коэффициент ββ\beta такой, что y=βx.y=βx.y = \beta x. Сегодня я узнал об общих наименьших квадратах, и эту princomp()функцию (анализ основных компонентов, PCA) можно использовать для ее выполнения. Это...