Вопросы с тегом «linear-model»

17
Как решить, какую семью GLM использовать?

У меня есть данные о плотности рыбы, которые я пытаюсь сравнить между несколькими различными методами сбора, у данных есть много нулей, и гистограмма выглядит неопределенной, соответствующей распределению Пуассона, за исключением того, что, как плотности, это не целочисленные данные. Я относительно...

16
Почему мы суетимся из-за использования очков Фишера, когда ставим GLM?

Мне любопытно, почему мы относимся к подгонке GLMS, как к какой-то особой проблеме оптимизации. Они? Мне кажется, что это просто максимальная вероятность, и мы записываем вероятность, а затем ... мы максимизируем ее! Так почему же мы используем оценку Фишера вместо множества схем оптимизации,...

16
Стратегия выбора подходящей модели для подсчета данных

Какова подходящая стратегия для решения, какую модель использовать с данными подсчета? У меня есть данные подсчета, которые мне нужно моделировать как многоуровневые модели, и мне (на этом сайте) было рекомендовано, что лучший способ сделать это - через ошибки или MCMCglmm. Однако я все еще пытаюсь...

16
Пирсон В.С. Остатки отклонений в логистической регрессии

Я знаю, что стандартизированные остатки Пирсона получены традиционным вероятностным способом: ri=yi−πiπi(1−πi)−−−−−−−−√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} и Остаточные отклонения получаются более статистическим способом (вклад каждой точки в вероятность):...

16
Имеет ли логарифмическая вероятность в GLM гарантированную сходимость к глобальным максимумам?

Мои вопросы: Обязательно ли обобщенные линейные модели (GLM) сходятся к глобальному максимуму? Если так, то почему? Кроме того, какие ограничения существуют для функции связи для обеспечения выпуклости? Мое понимание GLM состоит в том, что они максимизируют крайне нелинейную функцию правдоподобия....

16
Классическая линейная модель - выбор модели

У меня классическая линейная модель, с 5 возможными регрессорами. Они не связаны друг с другом и имеют довольно низкую корреляцию с ответом. Я пришел к модели, в которой 3 регрессора имеют значимые коэффициенты для своей t-статистики (р <0,05). Добавление одной или обеих оставшихся 2 переменных...

16
Как бы вы объяснили обобщенные линейные модели людям без статистического фона?

Мне всегда трудно объяснить статистические методы аудитории без статистического фона. Если бы я хотел объяснить, что такое GLM для такой аудитории (не выбрасывая статистический жаргон), что было бы лучшим или наиболее эффективным способом? Я обычно объясняю GLM тремя частями - (1) случайный...

16
Какая лучшая книга об обобщенных линейных моделях для новичков?

Я все еще довольно новичок в обобщенных линейных моделях, и я борюсь со многими обозначениями в большинстве текстов GLM, которые я выбрал. Существуют ли чрезвычайно популярные книги по GLM, которые лучше...

16
Почему GLM отличается от LM с преобразованной переменной

Как поясняется в раздаточном материале этого курса (стр. 1) , линейная модель может быть записана в виде: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, где - переменная ответа, а - пояснительная переменная .yyyxixix_{i}ithithi^{th} Часто с целью...

16
Когда мы можем говорить о коллинеарности

В линейных моделях нам нужно проверить, существует ли связь между объясняющими переменными. Если они слишком сильно коррелируют, то возникает коллинеарность (то есть переменные частично объясняют друг друга). В настоящее время я просто смотрю на попарную корреляцию между каждой из объясняющих...

15
VIF, индекс состояния и собственные значения

В настоящее время я оцениваю мультиколлинеарность в моих наборах данных. Какие пороговые значения VIF и индекса состояния ниже / выше указывают на проблему? VIF: я слышал, что VIF является проблемой.≥ 10≥10\geq 10 После удаления двух проблемных переменных VIF равен для каждой переменной. Нужно ли...

15
Эффективное обновление линейной регрессии при добавлении наблюдений и / или предикторов в R

Мне было бы интересно найти пути в R для эффективного обновления линейной модели при добавлении наблюдения или предиктора. У biglm есть возможность обновления при добавлении наблюдений, но мои данные достаточно малы, чтобы находиться в памяти (хотя у меня есть большое количество экземпляров для...

15
Для линейных классификаторов, большие коэффициенты подразумевают более важные особенности?

Я инженер-программист, работающий над машинным обучением. Насколько я понимаю, линейная регрессия (например, OLS) и линейная классификация (например, логистическая регрессия и SVM) делают прогноз на основе внутреннего произведения между обучаемыми коэффициентами и характеристическими переменными...

15
Если я повторю каждое наблюдение выборки в модели линейной регрессии и перезапущу регрессию, как повлияет на результат?

Скажем, у меня есть N наблюдений, возможно, несколько факторов, и я повторяю каждое наблюдение дважды (или М раз), как регрессия на этом новом наборе ЯМ размера будет сравниваться с регрессией только на исходных...

15
Могу ли я игнорировать коэффициенты для незначительных уровней факторов в линейной модели?

После поиска разъяснений по поводу коэффициентов линейной модели здесь у меня возник вопрос о не значащем значении (высокое значение p) для коэффициентов уровней факторов. Пример: если моя линейная модель включает в себя фактор с 10 уровнями, и только 3 из этих уровней имеют значимые значения p,...

15
Смешивать непрерывные и двоичные данные с линейным SVM?

Так что я играл с SVM, и мне интересно, хорошо ли это делать: У меня есть набор непрерывных функций (от 0 до 1) и набор категориальных функций, которые я преобразовал в фиктивные переменные. В этом конкретном случае я кодирую дату измерения в фиктивной переменной: У меня есть 3 периода, из которых...

15
Матричная запись для логистической регрессии

В линейной регрессии (квадрат потери), используя матрицу, мы получаем очень краткие обозначения для цели minimize  ∥Ax−b∥2minimize  ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Где AAA - матрица данных, xxx - коэффициенты, а bbb - ответ. Существует ли аналогичная матричная запись для цели логистической...

15
Определение ковариационной структуры: плюсы и минусы

Каковы преимущества указания ковариационной структуры в GLM (вместо того, чтобы рассматривать все недиагональные элементы в ковариационной матрице как ноль)? Помимо отражения того, что каждый знает о данных, делает это улучшить качество посадки? повысить точность прогнозирования на удерживаемых...

15
Может ли модель для неотрицательных данных со сгущением в нули (Tweedie GLM, нулевое раздувание GLM и т. Д.) Предсказать точные нули?

Распределение Твиди может моделировать искаженные данные с точечной массой в нуле, когда параметр (показатель степени в отношении средней дисперсии) находится между 1 и 2.pпp Точно так же модель с нулевой раздувкой (будь то непрерывная или дискретная) может иметь большое количество нулей. У меня...

15
Использование glm () вместо простого теста хи-квадрат

Я заинтересован в изменении нулевых гипотез, используя glm()в R. Например: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) проверяет гипотезу, что . Что если я захочу изменить значение null на = какое-то произвольное значение внутри ? рр = 0,5пзнак равно0,5p = 0.5ппpglm() Я знаю,...