Вопросы с тегом «regression»

16
Как смоделировать неотрицательные данные с нулевой раздувкой?

В настоящее время я пытаюсь применить линейную модель ( family = gaussian) к индикатору биоразнообразия, который не может принимать значения ниже нуля, имеет нулевое раздувание и непрерывен. Значения варьируются от 0 до чуть более 0,25. Как следствие, в остатках модели есть довольно очевидная...

16
Дискриминантный анализ против логистической регрессии

Я нашел некоторые плюсы дискриминантного анализа, и у меня есть вопросы о них. Так: Когда классы хорошо разделены, оценки параметров для логистической регрессии удивительно нестабильны. Коэффициенты могут уходить в бесконечность. LDA не страдает от этой проблемы. Если число признаков мало и...

16
Какова связь между частичными наименьшими квадратами, регрессией пониженного ранга и регрессией главных компонент?

Являются ли регрессия с пониженным рангом и регрессия главных компонентов просто частными случаями частичных наименьших квадратов? В этом руководстве (Страница 6, «Сравнение целей») утверждается, что когда мы делаем частичные наименьшие квадраты без проецирования X или Y (то есть «не частичные»),...

16
Почему мы говорим, что переменная результата «регрессирует» на предиктор (ы)?

Есть ли интуитивное объяснение этой терминологии? Почему это так, а не предсказатель (ы) регрессируют на результат? В идеале я надеюсь, что правильное объяснение того, почему существует эта терминология, поможет студентам запомнить ее и помешать им сказать это...

16
Определение естественных кубических сплайнов для регрессии

Я изучаю сплайны из книги Hastie et al. "Элементы статистического изучения данных: добыча, вывод и прогнозирование". На странице 145 я обнаружил, что естественные кубические сплайны линейны за граничными узлами. В есть узлов, и о таком сплайне в книге дается...

16
Обратная регрессия гребня: с учетом матрицы отклика и коэффициентов регрессии, найти подходящих предикторов

Рассмотрим стандартную задачу регрессии OLS \newcommand{\Y}{\mathbf Y}\newcommand{\X}{\mathbf X}\newcommand{\B}{\boldsymbol\beta}\DeclareMathOperator*{argmin}{argmin} : У меня есть матрицы YY\Y и XX\X и я хочу найти ββ\B чтобы минимизировать L=∥Y−Xβ∥2.L=‖Y−Xβ‖2.L=\|\Y-\X\B\|^2. Решение дается...

16
Какова связь между бета-распределением и моделью логистической регрессии?

Мой вопрос: какова математическая связь между распределением Бета и коэффициентами модели логистической регрессии ? Для иллюстрации: логистическая (сигмоидальная) функция задается f(x)=11+exp(−x)f(x)=11+exp⁡(−x)f(x) = \frac{1}{1+\exp(-x)} и он используется для моделирования вероятностей в модели...

16
Что такое нулевая модель в регрессии и как она связана с нулевой гипотезой?

Что такое нулевая модель в регрессии и какова связь между нулевой моделью и нулевой гипотезой? Насколько я понимаю, это значит Используя «среднее значение переменной отклика» для прогнозирования переменной непрерывного отклика? Использование «распределения меток» при прогнозировании дискретных...

16
Высокомерная регрессия: почему

Я пытаюсь прочитать об исследованиях в области регрессии больших размеров; когда больше , то есть . Похоже, термин часто встречается в терминах скорости сходимости для оценок регрессии.pppnnnp>>np>>np >> nlogp/nlog⁡p/n\log p/n Например, здесь уравнение (17) говорит, что для подгонки...

16
Почему потеря нормы L2 имеет единственное решение, а потеря нормы L1 может иметь несколько решений?

http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/ Если вы посмотрите на верхнюю часть этого поста, автор упомянет, что норма L2 имеет уникальное решение, а норма L1, возможно, имеет много решений. Я понимаю это с точки зрения регуляризации, но не с точки зрения...

15
Можно ли использовать множественную регрессию для прогнозирования одного главного компонента (ПК) от нескольких других ПК?

Некоторое время назад пользователь из списка рассылки R-help спросил о целесообразности использования оценок PCA в регрессии. Пользователь пытается использовать некоторые оценки ПК для объяснения изменений на другом ПК (см. Полное обсуждение здесь ). Ответ был таков: нет, это не так, потому что...

15
VIF, индекс состояния и собственные значения

В настоящее время я оцениваю мультиколлинеарность в моих наборах данных. Какие пороговые значения VIF и индекса состояния ниже / выше указывают на проблему? VIF: я слышал, что VIF является проблемой.≥ 10≥10\geq 10 После удаления двух проблемных переменных VIF равен для каждой переменной. Нужно ли...

15
Лагранжева релаксация в контексте гребневой регрессии

В «Элементах статистического обучения» (2-е изд.), Стр. 63, авторы приводят следующие две формулировки проблемы регрессии гребня: β^ridge=argminβ{∑i=1N(yi−β0−∑j=1pxijβj)2+λ∑j=1pβ2j}β^ridge=argminβ{∑i=1N(yi−β0−∑j=1pxijβj)2+λ∑j=1pβj2} \hat{\beta}^{ridge} = \underset{\beta}{\operatorname{argmin}}...

15
Доверительные интервалы для параметров регрессии: байесовский или классический

Учитывая два массива x и y длиной n, я подгоняю модель y = a + b * x и хочу рассчитать 95% доверительный интервал для наклона. Это (b - дельта, b + дельта), где b находится обычным образом и delta = qt(0.975,df=n-2)*se.slope и se.slope - стандартная ошибка на склоне. Один из способов получить...

15
Как моделировать цены?

Я задал этот вопрос на сайте обмена стеками matemathics, и его рекомендовали задать здесь. Я работаю над хобби-проектом и мне нужна помощь в решении следующей проблемы. Немного контекста Допустим, есть коллекция предметов с описанием возможностей и ценой. Представьте себе список автомобилей и цены....

15
Влияние функций и МНК

Я пытаюсь понять, как работают функции влияния. Может ли кто-то объяснить в контексте простой регрессии OLS yi=α+β⋅xi+εiyi=α+β⋅xi+εi\begin{equation} y_i = \alpha + \beta \cdot x_i + \varepsilon_i \end{equation} где я хочу функцию влияния для...

15
В чем может быть причина использования преобразования квадратного корня в данных?

Есть ли причина того, что я могу придумать, чтобы преобразовать данные с квадратным корнем? Я имею в виду, что я всегда наблюдаю, что R ^ 2 увеличивается. Но это, вероятно, только из-за центрирования данных! Любая мысль...

15
Эффективное обновление линейной регрессии при добавлении наблюдений и / или предикторов в R

Мне было бы интересно найти пути в R для эффективного обновления линейной модели при добавлении наблюдения или предиктора. У biglm есть возможность обновления при добавлении наблюдений, но мои данные достаточно малы, чтобы находиться в памяти (хотя у меня есть большое количество экземпляров для...

15
Если я повторю каждое наблюдение выборки в модели линейной регрессии и перезапущу регрессию, как повлияет на результат?

Скажем, у меня есть N наблюдений, возможно, несколько факторов, и я повторяю каждое наблюдение дважды (или М раз), как регрессия на этом новом наборе ЯМ размера будет сравниваться с регрессией только на исходных...

15
Как выбрать уровень значимости для большого набора данных?

Я работаю с набором данных, имеющих N около 200 000. В регрессиях я вижу очень маленькие значения значимости << 0,001, связанные с очень маленькими величинами эффекта, например, r = 0,028. Я хотел бы знать, есть ли принципиальный способ определения подходящего порога значимости по отношению к...