Сегодня я наткнулся на книгу Джеймса Стоуна «Теория информации: введение в учебное пособие» и несколько минут думал о степени использования теории информации в прикладной науке о данных (если вас не устраивает этот еще несколько нечеткий термин, вспомним анализ данных , который ИМХО в науке о данных является прославленной версией). Я хорошо осведомлен о значительном использовании основанных на теории информации подходов , методов и мер , особенно энтропии , под капотом различных статистических методов и методов анализа данных.
Однако мне любопытно, какой уровень знаний и знаний необходим прикладному социологу для успешного выбора и применения этих концепций, мер и инструментов, не вдаваясь слишком глубоко в математические истоки теории. Я с нетерпением жду ваших ответов, которые могут решить мою проблему в контексте вышеупомянутой книги (или других подобных книг - не стесняйтесь рекомендовать) или в целом.
Я также был бы признателен за некоторые рекомендации для печатных или онлайн-источников, в которых обсуждается теория информации и ее концепции, подходы, методы и меры в контексте (в сравнении с) других (более) традиционных статистических подходов ( частые и байесовские ).
источник
Ответы:
Итак, первая часть вопроса: нужно ли ученым, занимающимся данными, знать теорию информации ? Я думал, что ответ "нет" до недавнего времени. Причина, по которой я передумал, - это один из важнейших компонентов: шум.
Многие модели машинного обучения (как стохастические, так и нет) используют шум как часть своего процесса кодирования и преобразования, и во многих из этих моделей вам необходимо определить вероятность воздействия шума после декодирования преобразованного выходного сигнала модели. Я думаю, что это основная часть теории информации. Мало того, что в глубоком обучении дивергенция KL является очень важной мерой, используемой в теории информации.
Вторая часть вопроса: я думаю, что лучший источник - это теория информации Дэвида Маккея, алгоритмы вывода и обучения . Он начинает с теории информации и переносит эти идеи в логические и даже нейронные сети. Pdf бесплатно на сайте Дейва, и лекции онлайн, которые являются отличными
источник