Вопросы с тегом «regression-strategies»

12
Тест на пригодность в логистической регрессии; какую «посадку» мы хотим проверить?

Я имею в виду вопрос и его ответы: как сравнить (вероятностную) прогностическую способность моделей, разработанных на основе логистической регрессии? @ Clark Chong и ответы / комментарии @Frank Harrell. и к вопросу о Степени свободы в тесте Хосмера-Лемешоуχ2χ2\chi^2 и комментариях. Я прочитал...

12
Логистическая регрессия со сплайнами регрессии в R

Я разрабатывал модель логистической регрессии на основе ретроспективных данных из национальной базы данных о травмах головы в Великобритании. Ключевым результатом является 30-дневная смертность (обозначается как «выживаемая» мера). Другие меры с опубликованным доказательством существенного влияния...

12
Подсказки, что проблема хорошо подходит для линейной регрессии

Я изучаю линейную регрессию, используя Введение в анализ линейной регрессии Монтгомери, Пека и Вайнинга . Я хотел бы выбрать проект анализа данных. У меня наивная мысль, что линейная регрессия подходит только тогда, когда подозревают, что существуют линейные функциональные отношения между...

12
Когда подходит логистическая регрессия?

В настоящее время я учу себя, как делать классификацию, и, в частности, я смотрю на три метода: опорные векторные машины, нейронные сети и логистическая регрессия. Я пытаюсь понять, почему логистическая регрессия будет лучше, чем две другие. Исходя из моего понимания логистической регрессии, идея...

11
Как начать строить регрессионную модель, когда наиболее сильно ассоциированный предиктор является двоичным

У меня есть набор данных, содержащий 365 наблюдений трех переменных, а именно pm, tempи rain. Теперь я хочу проверить поведение pmв ответ на изменения в двух других переменных. Мои переменные: pm10 = Ответ (зависимый) temp = предиктор (независимый) rain = предиктор (независимый) Ниже приведена...

11
GLM с непрерывными данными, накопленными в нуле

Я пытаюсь использовать модель для оценки того, насколько катастрофические заболевания, такие как туберкулез, СПИД и т. Д., Влияют на расходы на госпитализацию. У меня есть «стоимость госпитализации» в качестве зависимой переменной и различные индивидуальные маркеры в качестве независимых...

11
Почему выбор характеристик важен для задач классификации?

Я учусь о выборе функций. Я понимаю, почему это важно и полезно для построения моделей. Но давайте сосредоточимся на контролируемых задачах обучения (классификации). Почему выбор характеристик важен для задач классификации? Я вижу много литературы, написанной о выборе функций и их использовании для...

10
Разъяснения относительно чтения номограммы

Ниже приведена номограмма, созданная из набора данных mtcars с пакетом rms для формулы: mpg ~ wt + am + qsec Сама модель кажется хорошей с R2 0,85 и P <0,00001 > mod Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes...

10
Использование LASSO только для выбора функций

В моем классе машинного обучения мы узнали о том, как регрессия LASSO очень хороша при выполнении выбора функций, поскольку она использует регуляризацию.L1L1l_1 Мой вопрос: люди обычно используют модель LASSO только для выбора функций (а затем переходят к сбросу этих функций в другую модель...

10
Особенности ранжирования в логистической регрессии

Я использовал логистическую регрессию. У меня есть шесть функций, я хочу знать важные функции в этом классификаторе, которые влияют на результат больше, чем другие функции. Я использовал информационное усиление, но, похоже, оно не зависит от используемого классификатора. Есть ли способ ранжировать...

10
Как мне моделировать взаимодействия между объясняющими переменными, если одна из них может иметь квадратные и кубические члены?

Я искренне надеюсь, что я сформулировал этот вопрос таким образом, чтобы на него можно было дать окончательный ответ - если нет, пожалуйста, дайте мне знать, и я попробую еще раз! Я должен также предположить, что я буду использовать R для этих анализов. У меня есть несколько мер, plant performance...

10
Зачем делать преобразование WOE категориальных предикторов в логистической регрессии?

Когда полезно преобразование весовых доказательств (WOE) категориальных переменных? Пример можно увидеть в трансформации WOE (Таким образом, для ответа , & категорического предиктора с категориями & из испытаний в й категории этого предиктора, WOE для й категории определяется какk y j n j j...

10
Лучший метод для создания диаграмм роста

Я должен создать диаграммы (аналогичные диаграммам роста) для детей в возрасте от 5 до 15 лет (только 5,6,7 и т. Д .; нет дробных значений, таких как 2,6 года) для переменной здоровья, которая является неотрицательной, непрерывной и диапазон 50-150 (только несколько значений за пределами этого...

10
Каковы критерии и решения для нелинейности в статистических моделях?

Я надеюсь, что следующий общий вопрос имеет смысл. Пожалуйста, имейте в виду, что для целей данного конкретного вопроса меня не интересуют теоретические (предметная область) причины введения нелинейности. Поэтому я сформулирую полный вопрос следующим образом: Какова логическая структура ( критерии...

9
Как интерпретировать переменные, которые исключены или включены в модель Лассо?

Из других сообщений я узнал, что нельзя приписывать «важность» или «значимость» переменным предикторам, которые входят в модель лассо, потому что вычисление p-значений или стандартных отклонений этих переменных все еще находится в стадии разработки. Исходя из этого рассуждения, правильно ли...

9
Логистическая регрессия на больших данных

У меня есть набор данных около 5000 функций. Для этих данных я сначала использовал тест Chi Square для выбора функции; после этого я получил около 1500 переменных, которые показали связь значимости с переменной отклика. Теперь мне нужно приспособить логистическую регрессию к этому. Я использую...

9
Как уменьшить предикторы правильным способом для модели логистической регрессии

Поэтому я читал некоторые книги (или их части) по моделированию (в частности, «Стратегии регрессионного моделирования» Ф. Харрелла), поскольку моя текущая ситуация сейчас заключается в том, что мне нужно создать логистическую модель, основанную на данных двоичного отклика. У меня есть как...