Вопросы с тегом «regression»

13
Формула для 95% доверительного интервала для

Я гуглил и искал по stats.stackexchange, но не могу найти формулу для расчета 95% доверительного интервала для значения для линейной регрессии. Кто-нибудь может это предоставить?р2R2R^2 Еще лучше, скажем, я выполнил линейную регрессию ниже в R. Как бы я вычислил 95% доверительный интервал для...

13
Интерпретация пропорций, суммирующих единицу, как независимых переменных в линейной регрессии

Я знаком с понятием категориальных переменных и соответствующим фиктивным кодированием переменных, которое позволяет нам соответствовать одному уровню в качестве базовой линии, чтобы избежать коллинеарности. Я также знаком с тем, как интерпретировать оценки параметров из таких моделей:...

13
Почему Даниэль Уилкс (2011) говорит, что регресс основного компонента «будет предвзятым»?

В « Статистических методах в атмосферных науках» Дэниел Уилкс отмечает, что множественная линейная регрессия может привести к проблемам, если между предикторами существуют очень сильные корреляции (3-е издание, стр. 559-560): Патология, которая может возникнуть при множественной линейной регрессии,...

13
Почему логистическая регрессия дает хорошо откалиброванные модели?

Я понимаю, что одной из причин, по которым логистическая регрессия часто используется для прогнозирования рейтинга кликов в Интернете, является то, что она производит хорошо откалиброванные модели. Есть ли хорошее математическое объяснение...

13
Зачем использовать групповое лассо вместо лассо?

Я прочитал, что группа Лассо используется для выбора переменных и разреженности в группе переменных. Я хочу знать интуицию, стоящую за этим утверждением. Почему группа лассо предпочтительнее лассо? Почему путь решения группы Лассо не является кусочно-линейным?...

13
Простая линейная регрессия, p-значения и AIC

Я понимаю, что эта тема поднималась несколько раз, например, здесь , но я все еще не уверен, как лучше интерпретировать мой результат регрессии. У меня есть очень простой набор данных, состоящий из столбца значений x и столбца значений y , разделенных на две группы в зависимости от местоположения...

13
Имеет ли смысл перекрестная энтропия смысл в контексте регрессии?

Имеет ли смысл перекрестная энтропия в контексте регрессии (в отличие от классификации)? Если да, не могли бы вы привести пример с игрушкой через TensorFlow? Если нет, то почему нет? Я читал о кросс-энтропии в Neural Networks и Deep Learning Майкла Нильсена, и кажется, что это то, что естественно...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

13
Зачем изучать линейную регрессию?

Учитывая две случайные величины ξξ\xi и ηη\eta мы можем вычислить их «коэффициент корреляции» ccc и сформировать линию наилучшего соответствия между этими двумя случайными переменными. У меня вопрос почему? 1) Существуют случайные величины, ξξ\xi и ηη\eta которые зависят наихудшим образом, т....

13
Почему существуют большие коэффициенты для полинома высшего порядка?

В книге Бишопа по машинному обучению обсуждается проблема подгонки полиномиальной функции к набору точек данных. Пусть M - порядок подогнанного многочлена. Это утверждает, что Мы видим, что с увеличением M величина коэффициентов обычно становится больше. В частности, для полинома M = 9 коэффициенты...

13
Можете ли вы дать простое интуитивное объяснение метода IRLS, чтобы найти MLE GLM?

Фон: Я пытаюсь следовать обзору Принстона оценки MLE для GLM . Я понимаю основы оценки MLE: likelihood, score, наблюдаемая и ожидаемая Fisher informationи Fisher scoringтехника. И я знаю, как обосновать простую линейную регрессию с помощью оценки MLE . Вопрос: Я не могу понять даже первую строку...

13
AIC регрессии гребня: степени свободы в зависимости от количества параметров

Я хочу рассчитать AICc модели регрессии гребня. Проблема в количестве параметров. Для линейной регрессии большинство людей предполагают, что число параметров равно количеству оценочных коэффициентов плюс сигма (дисперсия ошибки). Когда дело доходит до регрессии гребня, я читал, что след матрицы...

13
Что r, r в квадрате и остаточное стандартное отклонение говорят нам о линейных отношениях?

Немного предыстории Я работаю над интерпретацией регрессионного анализа, но я действительно запутался в значении r, r в квадрате и остаточного стандартного отклонения. Я знаю определения: характеризации r измеряет силу и направление линейной зависимости между двумя переменными на диаграмме...

13
Как сумма двух переменных может объяснить большую дисперсию, чем отдельные переменные?

Я получаю некоторые ошеломляющие результаты для корреляции суммы с третьей переменной, когда два предиктора отрицательно коррелируют. Что вызывает эти недоумения результаты? Пример 1: корреляция между суммой двух переменных и третьей переменной Рассмотрим формулу 16.23 на странице 427 текста...

13
Есть ли обстоятельства, в которых следует использовать ступенчатую регрессию?

В прошлом поэтапная регрессия использовалась во многих биомедицинских работах, но, похоже, она улучшается благодаря лучшему пониманию многих ее проблем. Однако многие старые рецензенты все еще просят об этом. В каких обстоятельствах ступенчатая регрессия играет свою роль и должна использоваться,...

13
Как запустить линейную регрессию в параллельном / распределенном режиме для настройки больших данных?

Я работаю над очень большой проблемой линейной регрессии, когда размер данных настолько велик, что их нужно хранить на кластере машин. Он будет слишком большим, чтобы объединить все образцы в память одного компьютера (даже диска). Чтобы выполнить регрессию этих данных, я думаю о параллельном...

13
Гармоническое среднее минимизирует сумму квадратов относительных ошибок

Я ищу ссылку, где доказано, что гармоническое среднее x¯h=n∑ni=11xix¯h=n∑i=1n1xi\bar{x}^h = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}} минимизирует (в zzz ) сумму квадратов относительных ошибок ∑i=1n((xi−z)2xi).∑i=1n((xi−z)2xi).\sum_{i=1}^n \left( \frac{(x_i -...

13
Противоречивые подходы к выбору переменных: AIC, p-значения или оба?

Из того, что я понимаю, выбор переменных на основе p-значений (по крайней мере, в контексте регрессии) является в высшей степени ошибочным. Похоже, что выбор переменных на основе AIC (или аналогичных) также считается ошибочным по некоторым причинам, хотя это кажется немного неясным (например, см....

13
Является ли справедливая идентификация 2SLS несмещенной?

В книге « В основном безвредная эконометрика: спутник эмпирика» (Angrist and Pischke, 2009: стр. 209) я прочитал следующее: (...) На самом деле, только что идентифицированный 2SLS (скажем, простой оценщик Вальда) примерно беспристрастен . Это трудно показать формально, потому что только что...