Вопросы с тегом «regression»

21
Добавление весов к логистической регрессии для несбалансированных данных

Я хочу смоделировать логистическую регрессию с несбалансированными данными (9: 1). Я хотел попробовать опцию весов в glmфункции в R, но я не уверен на 100%, что она делает. Допустим , моя переменная выход c(0,0,0,0,0,0,0,0,0,1). Теперь я хочу дать «1» в 10 раз больше веса. поэтому я даю весовой...

21
Каковы предположения о регрессии гребня и как их проверить?

Рассмотрим стандартную модель множественной регрессии где , так что нормальность, гомоскедастичность и некоррелированность ошибок сохраняются.Y= Xβ+ εY=Xβ+εY=X\beta+\varepsilonε ∼ N( 0 , σ2яN)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Предположим, что мы выполняем регрессию гребня,...

21
Подобные Anscombe наборы данных с одним и тем же блоком и графиком усов (среднее / стандартное / медианное / MAD / мин / макс)

РЕДАКТИРОВАТЬ: Поскольку этот вопрос был завышен, краткое изложение: поиск различных значимых и интерпретируемых наборов данных с одинаковой смешанной статистикой (среднее значение, медиана, средний диапазон и связанные с ними дисперсии и регрессия). Квартет Анскомба (см. « Цель визуализации...

21
Латентная переменная интерпретация обобщенных линейных моделей (GLM)

Укороченная версия: Мы знаем, что логистическая регрессия и пробит-регрессия могут быть интерпретированы как включающие в себя непрерывную скрытую переменную, которая дискретизируется согласно некоторому фиксированному порогу перед наблюдением. Доступна ли подобная интерпретация скрытой переменной,...

21
Разница между допущениями, лежащими в основе корреляционных и регрессионных тестов значимости наклона

Мой вопрос возник из обсуждения с @whuber в комментариях к другому вопросу . В частности, комментарий @whuber был следующим: Одна из причин, по которой вас это может удивить, заключается в том, что допущения, лежащие в основе теста корреляции и теста наклона регрессии, различны - поэтому даже когда...

21
Как мне улучшить мою нейронную сеть при прогнозировании синусоидальных волн?

Вот, посмотрите: вы можете точно увидеть, где заканчиваются тренировочные данные. Тренировочные данные идут от до 1 .- 1-1-1111 Я использовал Keras и плотную сеть 1-100-100-2 с активацией tanh. Я вычисляю результат по двум значениям, p и q как p / q. Таким образом, я могу получить любой размер...

21
Предел оценки гребневой регрессии «единичная дисперсия» при

Рассмотрим регрессию гребня с дополнительным ограничением, требующим, чтобы имел единичную сумму квадратов (эквивалентно, единичную дисперсию); при необходимости можно предположить, что имеет единичную сумму квадратов:y^y^\hat{\mathbf y}yy\mathbf y...

20
Всегда сообщать о надежных (белых) стандартных ошибках?

Angrist и Pischke предположили, что устойчивые (то есть устойчивые к гетероскедастичности или неравные отклонения) стандартные ошибки сообщаются как нечто само собой разумеющееся, а не как их проверка. Два вопроса: Как это влияет на стандартные ошибки при этом, когда есть гомоскедастичность?...

20
Когда вы можете использовать критерии на основе данных для определения регрессионной модели?

Я слышал, что когда многие спецификации регрессионных моделей (скажем, в OLS) рассматриваются как возможности для набора данных, это вызывает многочисленные проблемы сравнения, а значения p и доверительные интервалы перестают быть надежными. Одним из крайних примеров этого является ступенчатая...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

20
Оценка R-квадрата и статистической значимости по модели регрессионного наказания

Я использую пакет R, оштрафованный для получения сокращенных оценок коэффициентов для набора данных, где у меня много предикторов и мало известно о том, какие из них важны. После того, как я выбрал параметры настройки L1 и L2 и доволен своими коэффициентами, есть ли статистически обоснованный...

20
Усреднение значений корреляции

Допустим, я проверяю, как переменная Yзависит от переменной Xв различных экспериментальных условиях, и получаю следующий график: Штриховые линии на графике выше представляют линейную регрессию для каждого ряда данных (экспериментальная установка), а цифры в легенде обозначают корреляцию Пирсона для...

20
Построение линейной модели для соотношения в процентах?

Предположим, я хочу построить модель, чтобы предсказать какое-то соотношение или процент. Например, скажем, я хочу предсказать количество мальчиков и девочек, которые будут присутствовать на вечеринке, и особенности вечеринки, которые я могу использовать в модели, такие как количество рекламы для...

20
В чем разница между биномиальной регрессией и логистической регрессией?

Я всегда считал логистическую регрессию просто частным случаем биномиальной регрессии, где функция связи - это логистическая функция (вместо, скажем, пробитовой функции). Однако после прочтения ответов на другой вопрос, который у меня возник, звучит так, как будто я запутался, и есть разница между...

20
Порядок переменных в ANOVA имеет значение, не так ли?

Правильно ли я понимаю, что порядок, в котором переменные указываются в многофакторном ANOVA, имеет значение, но что порядок не имеет значения при выполнении множественной линейной регрессии? Таким образом, предполагая такой результат, как измеренная кровопотеря y и две категориальные переменные...

20
Интерпретация простой линейной регрессии

Я провел простую линейную регрессию натурального логарифма двух переменных, чтобы определить, коррелируют ли они. Мой вывод такой: R^2 = 0.0893 slope = 0.851 p < 0.001 Я запутался. Глядя на значение , я бы сказал, что две переменные не коррелированы, так как оно очень близко к . Однако наклон...

20
Сводка результатов «Большой p, маленький n»

Кто-нибудь может указать мне на обзорную статью о «Большой , Малый » результаты? Меня интересует, как эта проблема проявляется в различных исследовательских контекстах, например, регрессии, классификации, тесте Хотеллинга и т ....

20
Когда следует использовать множественную регрессию с фиктивным кодированием против ANCOVA?

Недавно я проанализировал эксперимент, который манипулировал 2 категориальными переменными и одной непрерывной переменной, используя ANCOVA. Однако рецензент предположил, что множественная регрессия с категориальной переменной, закодированной как фиктивная переменная, является более подходящим...

20
Когда исключить термин из регрессионной модели?

Может кто-нибудь посоветовать, если имеет смысл следующее: Я имею дело с обычной линейной моделью с 4 предикторами. Я в раздумье, отбросить ли наименее значимый термин. Это значение чуть более 0,05. Я высказался за то, чтобы привести его в соответствие с этим: умножение оценки этого термина на...