Я думал об этой проблеме. Обычная логистическая функция для моделирования двоичных данных: Но является ли функция логита, которая представляет собой S-образную кривую, всегда наилучшей для моделирования данных? Возможно, у вас есть основания полагать, что ваши данные не соответствуют нормальной S-образной кривой, а имеют другой тип кривой с областью(0,1).
Есть ли какие-либо исследования в этом? Может быть, вы можете смоделировать это как пробитную функцию или нечто подобное, но что, если это что-то совсем другое? Может ли это привести к лучшей оценке эффектов? Просто мысль у меня была, и мне интересно, есть ли какие-либо исследования в этом направлении.
logistic
references
link-function
лощина
источник
источник
Ответы:
Люди используют всевозможные функции, чтобы сохранить свои данные между 0 и 1. Логические шансы естественным образом выпадают из математики, когда вы выводите модель (это называется «канонической функцией связи»), но вы абсолютно свободны экспериментировать с другие альтернативы.
Как упоминал Макрос в своем комментарии к вашему вопросу, один из распространенных вариантов - это пробитная модель , в которой вместо логистической функции используется квантильная функция гауссиана. Я также слышал хорошие вещи об использовании функции квантиля распределения Стьюдента, хотя никогда не пробовал.T
Надеюсь это поможет.
Отредактировано, чтобы добавить : Обсуждение, с которым связан @Macro, действительно превосходно. Я настоятельно рекомендую прочитать его, если вы заинтересованы в более подробной информации.
источник
Я не вижу причины, априори, почему подходящей функцией связи для данного набора данных должен быть логит (хотя в целом юниверс кажется нам довольно добрым). Я не знаю, действительно ли это то, что вы ищете, но вот некоторые статьи, в которых обсуждаются более экзотические функции ссылок:
Каучит (и т. Д.):
Koenker, R. & Yoon, J. (2009). Параметрические связи для моделей бинарного выбора: фишерово-байесовский коллоквиум . Журнал эконометрики, 152, 2 , с. 120-130.
Koenker, R. (2006). Параметрические ссылки для моделей двоичного выбора . Rnews, 6, 4 , с. 32-34.
Скобит :
Наглер Дж. (1994). Scobit: альтернативный оценщик для логита и пробита . Американский журнал политических наук, 38, 1 , с. 230-255.
Косо-Пробит :
Базан, JL, Bolfarine, H. & Branco, MD (2010). Каркас для косо-пробитных связей в бинарной регрессии . Коммуникации в статистике - теория и методика, 39 , с. 678-697.
(Это похоже на хороший обзор перекошенных ссылок в байесовской структуре) :
Чен, MH (2004). Перекошенные модели ссылок для данных категориальных ответов . В косо-эллиптических распределениях и их приложениях: путешествие за пределы нормальности , Марк Гентон, редактор. Чепмен и Холл.
Раскрытие: я плохо знаю этот материал. Я пытался поболтать с Cauchit и Scobit пару лет назад, но мой код продолжал падать (возможно, потому что я не очень хороший программист), и это не имело значения для проекта, над которым я работал, поэтому я отбросил его ,
источник
Лучшая стратегия - моделировать данные в свете происходящего (не удивительно!)
Вероятно, нет исследований по этим моделям как таковым, хотя было проведено множество исследований ни по одной из этих моделей, и по сравнению между ними, и по различным способам их оценки. В литературе вы обнаружите, что какое-то время происходит много активности, так как исследователи рассматривают ряд вариантов для определенного класса проблем, а затем один из методов становится превосходным.
источник
источник