В статистике я должен предполагать, что

18

Я изучаю статистику и часто сталкиваюсь с формулами, содержащими, logи я всегда сбит с толку, если я должен интерпретировать это как стандартное значение log, то есть основание 10, или если в статистике символ log обычно считается натуральным логарифмом ln.

В частности, я изучаю оценку частоты Тьюринга в качестве примера, но мой вопрос носит более общий характер.

Джузеппе Романьуоло
источник
2
«Для многих приложений более удобно работать с натуральным логарифмом функции правдоподобия, называемой логарифмическим правдоподобием». en.wikipedia.org/wiki/Likelihood_function#Log-likelihood В статистике мы часто работаем с функцией правдоподобия, обычно рассматривается lnименно это. Тем не менее, оба взаимосвязаны: log(x) = ln(x) / ln(10) = ln(x) / 2.303и функция ln- правдоподобия достигает экстремума в той же точке, что и функция log10- правдоподобия.
John_West
5
В некоторых конкретных областях применения, когда упоминается log , подразумевается база 10, но, как указывает Аксакал, в противном случае в математике используется соглашение - что неукрашенный log означает натуральный журнал.
Glen_b
2
Как говорит @John_West, ln(x) и loga(x) идентичны с точностью до коэффициента масштабирования. Таким образом, они одинаковы только то, что вы измеряете в другой единице.
1
@Aksakal; то, что вы говорите, сводится к тому, что единица важна (см. мой комментарий выше), с чем я согласен. Я также написал loga явно указать базу. Для (некоторых) приложений в статистике, таких как максимальная вероятность, этот коэффициент масштабирования, однако, не имеет значения. Максимум не изменится после добавления коэффициента масштабирования. В отношении операционного ( в хорошем Тьюринга ...) они хотят построить Lограмм(Nр) (или Lограмм(Zр) ) в сравнении с Lограмм(р), Это означает, что единица измерения изменяется на обеих осях графика, поэтому построенная «кривая» не изменяется.
1
Если вы не пишете статью, даже при использовании логарифмической вероятности масштаб (основание логарифма) обычно имеет значение. Например, в статистике теста логарифмического отношения правдоподобия используется пер , вам придется настраиваться из другой базы, чтобы использовать критические значения. Если вы пишете программное обеспечение, важно правильно настроить базу при использовании функций правдоподобия журналов из документов и т. Д. Слишком много случаев, когда важно утверждать, что база не имеет значения.
Аксакал

Ответы:

20

Можно с уверенностью предположить, что без явной базы в статистике, потому что база 10 log не очень часто используется в статистике. Тем не менее, другие постеры поднимают вопрос о том, что log 10 или другие базы могут быть общими в некоторых других областях, где применяется статистика, например, теория информации. Поэтому, когда вы читаете статьи в других областях, это иногда сбивает с толку.журналзнак равнопержурнал10

Страница энтропии Википедии - хороший пример запутанного использования . На той же странице они означают базу 2, е и любую базу. Вы можете выяснить по контексту, какой из них имеется в виду, но это требует чтения текста. Это не хороший способ представить материал. Сравните это со страницей логарифма, где основание четко показано в каждой формуле или используется ln . Я лично думаю, что это путь: всегда показывать базу, когда используется знак журнала . Это также будет соответствовать ISO, поскольку стандарт не определяет использование неопределенной базы с символом журнала, как указал @Henry.журналепержурналжурнал

Наконец, стандарт ISO 31-11 предписывает знаки и lg для логарифмов оснований 2 и 10. Оба редко используются в наши дни. Я помню, что мы использовали LG в средней школе, но это было в другом столетии в другом мире. Я никогда не видел его с тех пор, как используется в статистическом контексте. Существует даже не тег для фунта в LaTeX.фунтЛ.Г.Л.Г.фунт

Аксакал
источник
1
Логарифмы Base 2 также довольно распространены в некоторых областях. Неокрашенный журнал редко является основой 10, но он не всегда является основой e .
Ядерный Ван
Полезно, но я думаю, что "редко" слишком сильно. Существуют основные области, в которых люди могут знать только о логарифмах с основанием 10 или, в лучшем случае, чувствовать себя наиболее знакомыми с ними. Обратите внимание, что на многих графиках показаны логарифмические шкалы с использованием степеней 10. Кто-то, предпочитающий натуральные логарифмы, не сталкивается с трудностями при декодировании таких шкал, но предполагается, что он имеет базовое значение 10.
Ник Кокс
@NickCox, OP специально указывает «статистику» как поле, и я не вижу, чтобы в статистике часто использовался логарифм с основанием 10.
Аксакал
Похоже, что ISO 31-11 указывает для журнала e и оставляет неопределенный журнал неопределеннымпержурналежурнал
Генри
1
@NickCox, я смягчил язык, ты поднял вопрос
Аксакал
14

По-разному.

За исключением нескольких контекстов, таких как преобразование значения в децибелы, логарифмы с основанием 10 довольно редко встречаются в уравнениях. Тем не менее, графики в масштабе журнала часто находятся в base-10, хотя это должно быть довольно легко проверить по меткам на осях.

В математическом контексте неукрашенное , скорее всего, будет натуральным бревном (т. Е. Log e или ln ). С другой стороны, информатика часто использует логарифмы с базой 2 ( журнал 2 ), и они не всегда четко обозначены как таковые. Хорошей новостью является то, что вы можете конвертировать между базами тривиально, а использование «неправильной» базы только сделает ваш ответ постоянным фактором.журналжурналепержурнал2

В статье Гэйла "Good-Turing Without Tears" 1995 года логарифмами в тексте на самом деле являются (так сказано на стр. 5), но код R / S + в приложении использует функцию, которая на самом деле log e или ln. , Как @Henry указывает ниже, это не имеет никакого практического значения.журнал10logжурналепер

Если бы я был вынужден угадать, вот некоторые эвристики:

  • Если также присутствуют степени 2, или 10, журналы, скорее всего, будут иметь соответствующую базу.е

  • Если это происходит в результате интегрирования (или, в более общем смысле, включает исчисление), это, вероятно, будет натуральный логарифм.1/Икс

  • Если это происходит из-за многократного деления чего-либо пополам (как при бинарном поиске), это, вероятно, будет . В более общем смысле, что-то можно разделить на n приблизительно log n раз.журнал2NжурналN

  • Информационно-теоретические вычисления обычно используют , особенно в современной работе. Тем не менее, вы можете проверить единицы измерения, чтобы быть уверенными: битыlog 2 , natsln и banslog 10 .журнал2битыжурнал2Natsперзапретыжурнал10

  • Нахождение точки, где функция падает или поднимается до , (37% и 63% соответственно) от первоначального значения предполагает натуральный логарифм.1е или 1-1е

Мэтт Краузе
источник
5
+1. Небольшой совет: если экспоненты найдены поблизости, то натуральный логарифм более вероятен и, наоборот, со степенями 10 или 2. Если какая база используется, остается неясной, попробуйте воспроизвести пример расчетов авторов. ехр()
Ник Кокс
2
Поскольку графики на страницах 6 и 7 статьи Гейла показывают исходные единицы измерения в логарифмическом масштабе, а расчеты направлены на наклон отношения log-log, т. Е. в выражении log ( N r ) = a + b log ( r ), что соответствует N r = A r b , в данном случае это не имеет никакого практического значенияblog(Nr)=a+blog(r)Nr=Arб
Генри
2
Другой пример , когда плетенки на фондовом рынке данных, при использовании цены журнала ось всегда основание 10.бasе10
Marcus D
3

Чтобы ответить на ваш вопрос: нет, вы не можете принять общую фиксированную запись для логарифма.

Подобный вопрос недавно обсуждался в SE.Math: в чем разница между тремя типами логарифмов? с математической точки зрения. Как правило, существуют различные обозначения, которые зависят от привычек ( кажется полезным в медицинских исследованиях ) или языка (например, на немецком, русском, французском). К сожалению, одна и та же запись иногда заканчивается представлением разных определений. Цитирование из вышеупомянутой ссылки SE.Math:log10

lnxlogexelogx10log10

log2log2журнале

0

Возвращаясь к вашей первоначальной мотивации, оценке частоты хорошего тьюринга, интересно прочитать «Частоты популяций видов и оценка параметров популяции» , IJ Good, Biometrika, 1953. Здесь он использовал логарифмы в разных контекстах: преобразование переменной для стабилизация дисперсии (с упоминанием Бартлетта и Анскомба), сумма гармонических рядов, энтропия. Мы видим, что он обычно использует как натуральный логарифм, и время от времени в статье указывается log e или log 10 , когда этого требует контекст. Для стабилизации дисперсии или оценки основной энтропии коэффициент логарифма не сильно меняет результат, так как результат допускает линейное изменение.журналжурналежурнал10

Лоран Дюваль
источник
0

епер(L^)L^К

AяСзнак равно2(К-пер(L)),

Таким образом, кажется, что если вы используете любую другую базу для логарифма в AIC, вы можете в итоге сделать неправильный вывод и выбрать неправильную модель.

Бьёрн Кьос-Ханссен
источник