Предположим, у нас есть случайная переменная, которая принимает нечисловые значения a, b, c и хочет количественно определить, как эмпирическое распределение выборок этой переменной отличается от истинного распределения. В этом случае применяется следующее неравенство (от Cover & Thomas ).
Теорема 12.4.1 (теорема Санова): Пусть - iid . Пусть - множество вероятностных распределений. Тогда где P ^ * = \ arg \ min_ {P \ in E} D (P || Q), является распределением в E , наиболее близким к Q по относительной энтропии.
Это неравенство довольно слабое для малых . Для бинарных результатов и граница Черноффа-Хеффдинга гораздо более жесткая.
Существует ли аналогичная строгая оценка для ?
pr.probability
chernoff-bound
Ярослав Булатов
источник
источник
Ответы:
Вы можете получить довольно хорошие оценки, рассматривая случайную переменную которая равна 1, если и ноль в противном случае (для начиная с испытаний и учетом категорий). При любом фиксированном независимы и , следовательно могут быть проанализированы с использованием Черновым границ. Тогда сделайте объединение, связанное по .Yя ж Икся= j 1 ≤ i ≤ n 1 ≤ j ≤ 3 J Yя ж ΣяYя ж J
Если вышесказанного недостаточно, советую взглянуть на модель шаров и урн, например, в учебнике Упфала и Митценмахера. Эта модель такая же, как у вас, за исключением того, что некоторые из ваших мусорных ведер могут иметь больше шаров, чем другие, не так ли? В этой модели есть несколько более изощренных методов, использующих приближения Пуассона, которые, вероятно, будут распространяться на ваши установки с неоднородными вероятностями бина.
источник
Нет ничего о границах Черноффа Хоффдинга, которые бы относились к булевым переменным. ЕслиИкс1, ... ,ИксN действительно ли случайные переменные имеют 0 ≤Икся≤ 1 Вы можете применить границу Черноффа. Хорошим справочником является «Концентрация меры для анализа рандомизированных алгоритмов» ( http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.120.2561&rep=rep1&type=pdf ).
источник