Я знаю работу Шеннона с энтропией, но в последнее время я работал над краткими структурами данных, в которых эмпирическая энтропия часто используется как часть анализа хранилища.
Шеннон определил энтропию информации, создаваемой отдельным источником информации, как , где - вероятность события , например, сгенерированного конкретного символа, и есть возможных событий.
Как указывает MCH в комментариях, эмпирическая энтропия является энтропией эмпирического распределения этих событий и поэтому определяется как где - количество наблюдаемых случаев события а - общее количество наблюдаемых событий. Это называется эмпирической энтропией нулевого порядка . Понятие Шеннона об условной энтропии имеет аналогичную эмпирическую версию более высокого порядка .
Шеннон не использовал термин «эмпирическая энтропия», хотя он, безусловно, заслуживает похвалы за эту концепцию. Кто первым использовал эту идею, а кто первым использовал (очень логичное) название эмпирической энтропии для ее описания?
источник
Ответы:
Я заинтересован в «эмпирической энтропии», как вы, и самая ранняя статья, которую я нашел, была из Косараджу, как пользователь «Марцио Де Биаси», сказал в своем комментарии.
Но, по моему мнению, реальные определения «эмпирической энтропии» будут сделаны позже путем обобщения первых понятий:
Gagie перефразировать определениеК 3-й порядок эмпирической энтропии для:
где - марковский процесс го порядка. Он также показал, что это определение эквивалентно предыдущему. Следующим шагом Витани было обобщение на произвольные классы процессов (не только марковских):Q К
где - класс разрешенных процессов, а - колмогоровская сложность. Если мы выберем классом марковских процессов го порядка, создающих последовательностьслучайные величины и игнорирование колмогоровской сложности, чем это также приводит к определению Гэги (умноженному на ).Икс К( Х)
Икс К | ш | | ш |
источник