Вопросы с тегом «regression»

12
Моделирование, когда зависимая переменная имеет «отсечение»

Заранее извиняюсь, если какая-либо терминология, которую я использую, неверна. Я бы приветствовал любое исправление. Если то, что я называю «отсечкой», носит другое имя, дайте мне знать, и я смогу обновить вопрос. Интересующая меня ситуация такова: у вас есть независимые переменные и одна зависимая...

12
Информация вне матрицы для логистической регрессии

Мне ясно и хорошо объяснено на нескольких сайтах, какую информацию дают значения на диагонали матрицы шляп для линейной регрессии. Шляпная матрица модели логистической регрессии мне менее понятна. Идентична ли она той информации, которую вы получаете из шляпной матрицы, применяя линейную регрессию?...

12
Допущения остаточного распределения регрессии

Почему необходимо сделать предположение о распределении ошибок, т.е. ϵ i ∼ N ( 0 , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , с .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Почему бы не написать у я ~ Н ( Х β , сг 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , с...

12
Рассчитать логарифмическое правдоподобие «вручную» для обобщенной нелинейной регрессии наименьших квадратов (nlme)

Я пытаюсь вычислить логарифмическую вероятность для обобщенной нелинейной регрессии наименьших квадратов для функции оптимизированной с помощью функция в пакете R , используя ковариационную матрицу дисперсии, генерируемую расстояниями на филогенетическом дереве, предполагающем броуновское движение...

12
Ягодная инверсия

У меня есть большие совокупные рыночные данные о продажах вина в США, и я хотел бы оценить спрос на некоторые высококачественные вина. Эти доли рынка были в основном получены из случайной полезной модели вида где включает в себя наблюдаемые характеристики продукта, обозначает цены продукта, -...

12
Сравнение коэффициентов регрессии одной и той же модели в разных наборах данных

Я оцениваю два (2) хладагента (газа), которые использовались в одной и той же системе охлаждения. У меня есть данные о температуре всасывания ( ), температуре конденсации ( ) и силе тока ( ) для оценки. Есть два (2) набора данных; 1-й хладагент ( ) и 2-й хладагент ( ). Я использую линейную,...

12
Можем ли мы сделать вероятностные утверждения с интервалами прогнозирования?

Я прочитал много отличных обсуждений на сайте относительно интерпретации доверительных интервалов и интервалов прогнозирования, но одна концепция все еще немного озадачивает: Рассмотрим структуру OLS, и мы получили подходящую модель . Нам дали и попросили предсказать его ответ. Мы вычисляем и, в...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
В чем проблема использования R-квадрата в моделях временных рядов?

Я читал, что использование R-квадрата для временных рядов не подходит, потому что в контексте временных рядов (я знаю, что существуют другие контексты) R-квадрат больше не уникален. Почему это? Я пытался найти это, но я ничего не нашел. Обычно я не придаю особого значения R-квадрату (или...

12
Являются ли нормально распределенные X и Y более вероятными в результате нормально распределенных остатков?

Здесь обсуждается неправильное толкование предположения о нормальности в линейной регрессии (что «нормальность» относится к X и / или Y, а не к остаткам), и автор спрашивает, возможно ли иметь ненормально распределенные X и Y и все еще имеют нормально распределенные остатки. Мой вопрос: нормально...

12
Вывод регуляризованной функции стоимости линейной регрессии на курс Coursera Machine Learning

Я взял курс Эндрю Нг «Машинное обучение» через Coursera несколько месяцев назад, не обращая внимания на большую часть математики / дериваций и вместо этого сосредоточившись на практической реализации. С тех пор я начал возвращаться к изучению основополагающей теории и пересмотрел некоторые лекции...

12
Почему R требует много времени для подбора модели с многоуровневым фактором?

Я подхожу к модели с многовариантным множителем, и R требует очень много времени, чтобы соответствовать этой модели. Почему это? Например, если я подгоняю регрессию к прогнозированию зарплат игроков и включаю предиктор факторов для всех национальностей игроков, это займет больше времени, чем...

12
Понимание параметров функции Gaussian Basis для использования в линейной регрессии

Я хотел бы применить базисную функцию Гаусса в реализации линейной регрессии. К сожалению, мне сложно понять пару параметров в базовой функции. В частности, и .σμμ\muσσ\sigma Мой набор данных - это матрица размером 10 000 x 31 10000 образцов и 31 функций. Я читал, что «Каждая базисная функция...

12
Хребет & ЛАССО норм

Этот пост следует за этим: Почему оценка гребня становится лучше, чем OLS, добавляя константу к диагонали? Вот мой вопрос: Насколько я знаю, в регуляризации хребта используется (евклидово расстояние). Но почему мы используем квадрат этой нормы? (прямое применение приведет к получению квадратного...

12
понимание р-значения в множественной линейной регрессии

Что касается p-значения множественного линейного регрессионного анализа, введение с веб-сайта Minitab приведено ниже. Значение p для каждого члена проверяет нулевую гипотезу о том, что коэффициент равен нулю (без эффекта). Низкое значение p (<0,05) означает, что вы можете отклонить нулевую...

12
Сверхдисперсность и моделирование в пуассоновских моделях случайных эффектов со смещениями

Я столкнулся с рядом практических вопросов при моделировании данных подсчета из экспериментальных исследований с использованием эксперимента внутри объекта. Я кратко опишу эксперимент, данные и то, что я уже сделал, а затем мои вопросы. Четыре различных фильма были показаны выборке респондентов в...

12
Можно ли строить линию регрессии для ранжированных данных (корреляция Спирмена)?

У меня есть данные, для которых я рассчитал корреляцию Спирмена и хочу визуализировать их для публикации. Зависимая переменная ранжируется, независимая переменная - нет. То, что я хочу визуализировать, является скорее общей тенденцией, чем фактическим наклоном, поэтому я оценил независимую и...