почему это помогает с числами, ограниченными сверху и снизу?
Распределение, определенное на делает его подходящим в качестве модели для данных на . Я не думаю, что текст подразумевает нечто большее, чем «это модель для данных о » (или, в более общем смысле, о ).( 0 , 1 ) ( 0 , 1 ) ( а , б )( 0 , 1 )( 0 , 1 )( 0 , 1 )( а , б )
что это за распределение ...?
Термин «распределение логарифмов», к сожалению, не совсем стандартный (и даже тогда не очень распространенный).
Я расскажу о некоторых возможностях того, что это может означать. Начнем с рассмотрения способа построения распределений для значений в единичном интервале.
Обычным способом моделирования непрерывной случайной величины в является бета-распределение , а распространенным способом моделирования дискретных пропорций в является масштабированный бином ( , по крайней мере, когда это счет).( 0 , 1 ) [ 0 , 1 ]п( 0 , 1 )[ 0 , 1 ]Xп= Х/ нИкс
Альтернативой использованию бета-распределения было бы взять некоторый непрерывный обратный CDF ( ) и использовать его для преобразования значений в в реальную линию (или реальную реальную половину линии). а затем используйте любое соответствующее распределение ( ) для моделирования значений в преобразованном диапазоне. Это открывает много возможностей, поскольку любая пара непрерывных распределений на вещественной прямой ( ) доступна для преобразования и модели. ( 0 , 1 ) G F , GF- 1( 0 , 1 )гF, Г
Так, например, преобразование log-odds (также называемое logit ) будет одним из таких обратных преобразований cdf (являющихся обратным CDF стандартной логистики ) , а затем есть много дистрибутивов , мы могли бы рассмотреть в качестве моделей для .УY= журнал( P1 - П)Y
Затем мы могли бы использовать (например) логистическую модель для , простого двухпараметрического семейства на вещественной прямой. Преобразование обратно в посредством обратного преобразования log-odds (то есть ) дает двухпараметрическое распределение для , которое может быть унимодальный, или U-образный, или J-образный, симметричный или наклонный, во многом чем-то вроде бета-распределения (лично я бы назвал это logit-logistic, так как его logit является logistic). Вот несколько примеров для различных значений :Y ( 0 , 1 ) P = exp ( Y )( μ , τ)Y( 0 , 1 ) Pμ,τп= опыт( Y)1 + опыт( Y)пμ , τ
Глядя на краткое упоминание в тексте Witten et al., Это может быть то, что подразумевается под «распределением лог-шансов», но они могут так же легко означать что-то другое.
Другая возможность состоит в том, что logit-normal был предназначен.
Однако этот термин, по-видимому, использовался van Erp & van Gelder (2008) , например, для обозначения преобразования log-odds в бета-распределении (таким образом, в действительности, принимая за логистику и как распределение логарифма бета-простой случайной величины или, что эквивалентно, распределение разности логарифмов двух случайных величин хи-квадрат). Тем не менее, они используют это, чтобы сделать пропорции подсчета моделей , которые являются дискретными. Это, конечно, приводит к некоторым проблемам (вызванным попыткой смоделировать распределение с конечной вероятностью в 0 и 1 с одним на FG(0,1)[ 1 ]Fг( 0 , 1 )), на что они, кажется, тратят много сил. (Казалось бы, легче просто избежать неуместной модели, но, возможно, это только я.)
Несколько других документов (я нашел по крайней мере три) ссылаются на примерное распределение log-odds (то есть в масштабе выше) как «распределение log-odds» (в некоторых случаях, когда - дискретная пропорция *, а в некоторых случаи, когда это непрерывная пропорция) - так что в этом случае это не модель вероятности как таковая, но это то, к чему вы могли бы применить некоторую модель распределения на реальной линии.PYп
* опять же, проблема в том, что если равно 0 или 1, значение будет равно или соответственно ... что говорит о том, что мы должны ограничить распределение от 0 и 1, чтобы использовать его для этой цели ,пY- ∞∞
В диссертации Яна Го (2009 г.) этот термин используется для обозначения логистического распределения, правостороннего распределения на реальной полуоси.[ 2 ]
Итак, как вы видите, это не термин с одним значением. Без более четких указаний от Виттена или одного из других авторов этой книги нам остается только догадываться, что предполагается.
[1]: Ноэль ван Эрп и Питер ван Гелдер, (2008),
"Как интерпретировать распределение бета в случае поломки",
Материалы 6-го международного вероятностного семинара , Дармштадт
pdf link
[2]: Ян Го, (2009 г.),
«Новые методы оценки возможностей и надежности модулей NDE»,
представленные в аспирантуру Уэйнского государственного университета, Детройт, Мичиган
Я инженер-программист (не статистик), и недавно я прочитал книгу под названием «Введение в статистическое обучение». С приложениями в R.
Я думаю, что вы читаете о log-odds или logit. страница 132
http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf
Блестящая книга - я читаю ее от корки до корки. Надеюсь это поможет
источник