Вопросы с тегом «multivariate-analysis»

23
Случайные леса для многомерной регрессии

У меня проблема регрессии с несколькими выходами с входными функциями и выходными . Выходы имеют сложную нелинейную корреляционную структуру.dxdxd_xdydyd_y Я хотел бы использовать случайные леса, чтобы сделать регрессию. Насколько я могу судить, случайные леса для регрессии работают только с одним...

23
Распределение наблюдательного уровня по расстоянию Махаланобиса

Если у меня есть многовариантный нормальный пример iid , и я определяю (что-то вроде расстояния Махаланобиса [в квадрате] от точки выборки до вектора с использованием матрицы для взвешивания), каково распределение (расстояние Махаланобиса до среднее значение с использованием выборочной...

22
Что такое «регрессия пониженного ранга»?

Я читал «Элементы статистического обучения» и не мог понять, что такое раздел 3.7 «Сжатие и выбор нескольких результатов». В нем говорится о RRR (регрессии пониженного ранга), и я могу только понять, что предпосылка заключается в обобщенной многомерной линейной модели, в которой коэффициенты...

21
Что говорит о моих данных неположительно определенная ковариационная матрица?

У меня есть несколько многовариантных наблюдений, и я хотел бы оценить плотность вероятности по всем переменным. Предполагается, что данные нормально распределены. При небольших количествах переменных все работает так, как я ожидал, но переход к большим числам приводит к тому, что ковариационная...

20
Сводка результатов «Большой p, маленький n»

Кто-нибудь может указать мне на обзорную статью о «Большой , Малый » результаты? Меня интересует, как эта проблема проявляется в различных исследовательских контекстах, например, регрессии, классификации, тесте Хотеллинга и т ....

20
Что в названии: Точность (обратная дисперсия)

Интуитивно понятно, что среднее - это просто среднее из наблюдений. Разница заключается в том, насколько эти наблюдения отличаются от среднего значения. Я хотел бы знать, почему обратная дисперсия называется точностью. Какую интуицию мы можем извлечь из этого? И почему матрица точности так же...

18
Как выполнить изометрическое логарифмическое преобразование

У меня есть данные о поведении при движении (время, проведенное во сне, сидячий образ жизни и выполнение физических упражнений), которое составляет приблизительно 24 (как в часах в день). Я хочу создать переменную, которая фиксирует относительное время, затрачиваемое на каждое из этих поведений, -...

18
Построение распределения Дирихле с гамма-распределением

Пусть X1,…,Xk+1X1,…,Xk+1X_1,\dots,X_{k+1} - взаимно независимые случайные величины, каждая из которых имеет гамма-распределение с параметрами αi,i=1,2,…,k+1αi,i=1,2,…,k+1\alpha_i,i=1,2,\dots,k+1 показывают, что...

17
классификация переменной превращает ее из незначительной в значительную

У меня есть числовая переменная, которая оказывается несущественной в многомерной модели логистической регрессии. Однако, когда я делю это на группы, это внезапно становится значительным. Это очень нелогично для меня: при категоризации переменной мы отказываемся от некоторой информации. Как это...

17
Фиттинг многомерный, натуральный кубический сплайн

примечание: без правильных ответов через месяц я разместил сообщение на SO Фон У меня есть модель, fff , где Y=f(X)Y=f(X)Y=f(\textbf{X}) XX\textbf{X} -матрица выборок изпараметров размером а-векторвыходных данных модели.n×mn×mn \times mmmmYYYn×1n×1n \times 1 fff требует большого объема вычислений,...

16
Наименее глупый способ прогнозирования коротких многомерных временных рядов

Мне нужно спрогнозировать следующие 4 переменные для 29-й единицы времени. У меня есть исторические данные примерно за 2 года, где 1 и 14 и 27 - все один и тот же период (или время года). В конце я делаю разложение в стиле Оахака-Блиндера на WWW , wdwdwd , wcwcwc и ppp . time W wd wc p 1 4.920725...

16
Дискриминантный анализ против логистической регрессии

Я нашел некоторые плюсы дискриминантного анализа, и у меня есть вопросы о них. Так: Когда классы хорошо разделены, оценки параметров для логистической регрессии удивительно нестабильны. Коэффициенты могут уходить в бесконечность. LDA не страдает от этой проблемы. Если число признаков мало и...

15
Плотность нормального распределения при увеличении размеров

Вопрос, который я хочу задать, заключается в следующем: как изменяется доля выборок в пределах 1 SD от среднего значения нормального распределения с увеличением числа вариаций? (Почти) всем известно, что при одномерном нормальном распределении 68% выборок можно найти в пределах 1 стандартного...

15
Коррелированные испытания Бернулли, многомерное распределение Бернулли?

Я упрощаю вопрос исследования, который у меня есть на работе. Представьте, что у меня 5 монет, и давайте назовем головы успешными. Это ОЧЕНЬ смещенные монеты с вероятностью успеха p = 0.1. Теперь, если монеты были независимыми, а затем получить вероятность , по крайней мере 1 голову или более очень...

15
Как построить эллипс из собственных значений и собственных векторов в R? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Может ли кто-нибудь придумать R- код для построения эллипса из собственных значений и собственных...

15
Канонический корреляционный анализ с ранговой корреляцией

Канонический корреляционный анализ (CCA) стремится максимизировать обычную корреляцию Пирсона с моментом произведения (то есть линейный коэффициент корреляции) линейных комбинаций двух наборов данных. Теперь рассмотрим тот факт , что этот коэффициент корреляции только измеряет линейные ассоциаций -...

15
Внедряет ли GSVD все линейные многомерные методы?

Я наткнулся на статью Эрве Абди об обобщенном СВД. Автор упомянул: Обобщенный SVD (GSVD) разбивает прямоугольную матрицу и учитывает ограничения, накладываемые на строки и столбцы матрицы. GSVD дает взвешенную обобщенную оценку наименьших квадратов данной матрицы с помощью матрицы более низкого...

14
Вычислительно эффективная оценка многомерного режима

Короткая версия: Какой наиболее эффективный в вычислительном отношении метод оценки режима многомерного набора данных, взятого из непрерывного распределения? Длинная версия: у меня есть набор данных, который мне нужен для оценки режима. Режим не совпадает со средним или медианой. Пример показан...

14
Как определить, когда регрессионная модель перегружена?

Когда вы выполняете эту работу, осознавая, что вы делаете, у вас появляется чувство, когда вы переоцениваете модель. Во-первых, вы можете отследить тренд или ухудшение скорректированного квадрата R модели. Также можно отследить аналогичное ухудшение значений p коэффициентов регрессии основных...

14
Способ генерации коррелированных ненормальных данных

Я заинтересован в поиске метода для генерации коррелированных, ненормальных данных. Таким образом, в идеале это некое распределение, которое принимает в качестве параметра ковариационную (или корреляционную) матрицу и генерирует данные, которые приближаются к ней. Но здесь есть одна загвоздка:...