Вопросы с тегом «regression»

13

Формула для 95% доверительного интервала для

Я гуглил и искал по stats.stackexchange, но не могу найти формулу для расчета 95% доверительного интервала для значения для линейной регрессии. Кто-нибудь может это предоставить?р2R2R^2 Еще лучше, скажем, я выполнил линейную регрессию ниже в R. Как бы я вычислил 95% доверительный интервал для...

13

Интерпретация пропорций, суммирующих единицу, как независимых переменных в линейной регрессии

Я знаком с понятием категориальных переменных и соответствующим фиктивным кодированием переменных, которое позволяет нам соответствовать одному уровню в качестве базовой линии, чтобы избежать коллинеарности. Я также знаком с тем, как интерпретировать оценки параметров из таких моделей:...

regression interpretation proportion multicollinearity

13

Почему Даниэль Уилкс (2011) говорит, что регресс основного компонента «будет предвзятым»?

В « Статистических методах в атмосферных науках» Дэниел Уилкс отмечает, что множественная линейная регрессия может привести к проблемам, если между предикторами существуют очень сильные корреляции (3-е издание, стр. 559-560): Патология, которая может возникнуть при множественной линейной регрессии,...

regression pca bias

13

Почему логистическая регрессия дает хорошо откалиброванные модели?

Я понимаю, что одной из причин, по которым логистическая регрессия часто используется для прогнозирования рейтинга кликов в Интернете, является то, что она производит хорошо откалиброванные модели. Есть ли хорошее математическое объяснение...

regression logistic

13

Зачем использовать групповое лассо вместо лассо?

Я прочитал, что группа Лассо используется для выбора переменных и разреженности в группе переменных. Я хочу знать интуицию, стоящую за этим утверждением. Почему группа лассо предпочтительнее лассо? Почему путь решения группы Лассо не является кусочно-линейным?...

regression feature-selection lasso regularization

13

Простая линейная регрессия, p-значения и AIC

Я понимаю, что эта тема поднималась несколько раз, например, здесь , но я все еще не уверен, как лучше интерпретировать мой результат регрессии. У меня есть очень простой набор данных, состоящий из столбца значений x и столбца значений y , разделенных на две группы в зависимости от местоположения...

regression p-value least-squares aic

13

Имеет ли смысл перекрестная энтропия смысл в контексте регрессии?

Имеет ли смысл перекрестная энтропия в контексте регрессии (в отличие от классификации)? Если да, не могли бы вы привести пример с игрушкой через TensorFlow? Если нет, то почему нет? Я читал о кросс-энтропии в Neural Networks и Deep Learning Майкла Нильсена, и кажется, что это то, что естественно...

regression entropy tensorflow cross-entropy

13

Как определить область отказа, когда нет UMP?

Рассмотрим модель линейной регрессии ,y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} ,u∼N(0,σ2I)u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) .E(u∣X)=0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} Пусть против H 1 : σ 2 0 ≠ σ 2 .H0:σ20=σ2H0:σ02=σ2H_0:...

regression hypothesis-testing mathematical-statistics inference

13

Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

13

Зачем изучать линейную регрессию?

Учитывая две случайные величины ξξ\xi и ηη\eta мы можем вычислить их «коэффициент корреляции» ccc и сформировать линию наилучшего соответствия между этими двумя случайными переменными. У меня вопрос почему? 1) Существуют случайные величины, ξξ\xi и ηη\eta которые зависят наихудшим образом, т....

regression

13

Почему существуют большие коэффициенты для полинома высшего порядка?

В книге Бишопа по машинному обучению обсуждается проблема подгонки полиномиальной функции к набору точек данных. Пусть M - порядок подогнанного многочлена. Это утверждает, что Мы видим, что с увеличением M величина коэффициентов обычно становится больше. В частности, для полинома M = 9 коэффициенты...

regression least-squares curve-fitting polynomial

13

Можете ли вы дать простое интуитивное объяснение метода IRLS, чтобы найти MLE GLM?

Фон: Я пытаюсь следовать обзору Принстона оценки MLE для GLM . Я понимаю основы оценки MLE: likelihood, score, наблюдаемая и ожидаемая Fisher informationи Fisher scoringтехника. И я знаю, как обосновать простую линейную регрессию с помощью оценки MLE . Вопрос: Я не могу понять даже первую строку...

regression generalized-linear-model maximum-likelihood link-function irls

13

AIC регрессии гребня: степени свободы в зависимости от количества параметров

Я хочу рассчитать AICc модели регрессии гребня. Проблема в количестве параметров. Для линейной регрессии большинство людей предполагают, что число параметров равно количеству оценочных коэффициентов плюс сигма (дисперсия ошибки). Когда дело доходит до регрессии гребня, я читал, что след матрицы...

regression aic ridge-regression degrees-of-freedom

13

Что r, r в квадрате и остаточное стандартное отклонение говорят нам о линейных отношениях?

Немного предыстории Я работаю над интерпретацией регрессионного анализа, но я действительно запутался в значении r, r в квадрате и остаточного стандартного отклонения. Я знаю определения: характеризации r измеряет силу и направление линейной зависимости между двумя переменными на диаграмме...

r regression regression-coefficients linear pearson-r

13

Как сумма двух переменных может объяснить большую дисперсию, чем отдельные переменные?

Я получаю некоторые ошеломляющие результаты для корреляции суммы с третьей переменной, когда два предиктора отрицательно коррелируют. Что вызывает эти недоумения результаты? Пример 1: корреляция между суммой двух переменных и третьей переменной Рассмотрим формулу 16.23 на странице 427 текста...

correlation multiple-regression

13

Есть ли обстоятельства, в которых следует использовать ступенчатую регрессию?

В прошлом поэтапная регрессия использовалась во многих биомедицинских работах, но, похоже, она улучшается благодаря лучшему пониманию многих ее проблем. Однако многие старые рецензенты все еще просят об этом. В каких обстоятельствах ступенчатая регрессия играет свою роль и должна использоваться,...

regression multiple-regression feature-selection model-selection stepwise-regression

13

Как запустить линейную регрессию в параллельном / распределенном режиме для настройки больших данных?

Я работаю над очень большой проблемой линейной регрессии, когда размер данных настолько велик, что их нужно хранить на кластере машин. Он будет слишком большим, чтобы объединить все образцы в память одного компьютера (даже диска). Чтобы выполнить регрессию этих данных, я думаю о параллельном...

regression linear large-data

13

Гармоническое среднее минимизирует сумму квадратов относительных ошибок

Я ищу ссылку, где доказано, что гармоническое среднее x¯h=n∑ni=11xix¯h=n∑i=1n1xi\bar{x}^h = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}} минимизирует (в zzz ) сумму квадратов относительных ошибок ∑i=1n((xi−z)2xi).∑i=1n((xi−z)2xi).\sum_{i=1}^n \left( \frac{(x_i -...

references mean error weighted-regression harmonic-mean

13

Противоречивые подходы к выбору переменных: AIC, p-значения или оба?

Из того, что я понимаю, выбор переменных на основе p-значений (по крайней мере, в контексте регрессии) является в высшей степени ошибочным. Похоже, что выбор переменных на основе AIC (или аналогичных) также считается ошибочным по некоторым причинам, хотя это кажется немного неясным (например, см....

hypothesis-testing multiple-regression feature-selection model-selection aic

13

Является ли справедливая идентификация 2SLS несмещенной?

В книге « В основном безвредная эконометрика: спутник эмпирика» (Angrist and Pischke, 2009: стр. 209) я прочитал следующее: (...) На самом деле, только что идентифицированный 2SLS (скажем, простой оценщик Вальда) примерно беспристрастен . Это трудно показать формально, потому что только что...

regression self-study multiple-regression econometrics instrumental-variables