Прежде всего, я понял, что если мне нужно выполнить двоичные предсказания, я должен создать как минимум два класса, выполняя горячее кодирование. Это верно? Однако является ли двоичная кросс-энтропия только для предсказаний только с одним классом? Если бы я использовал категориальную кросс-энтропийную потерю, которая обычно встречается в большинстве библиотек (например, TensorFlow), будет ли существенная разница?
На самом деле, каковы точные различия между категориальной и бинарной кросс-энтропией? Я никогда не видел реализации двоичной кросс-энтропии в TensorFlow, поэтому я подумал, что, возможно, категориальная работает так же хорошо.
Ответы:
Биноминальная кросс-энтропийная потеря является частным случаем полиномиальной кросс-энтропийной потери при .м = 2
Где индексирует выборки / наблюдения и индексирует классы, а - метка выборки (двоичная для LSH, горячий вектор на RHS) и - прогноз для выборки.я J Y пя ж∈ ( 0 , 1 ) : ∑Jпя ж= 1 ∀ i , j
источник
Двоичная кросс-энтропия предназначена для классификации по нескольким меткам, тогда как категориальная кросс-энтропия предназначена для классификации по нескольким классам, где каждый пример принадлежит одному классу.
источник
Я думаю, что есть три вида задач классификации:
Из них можно сказать
Я хочу подчеркнуть, что мультиклассовая классификация не похожа на мультибликовую классификацию ! Скорее, мультибликовый классификатор заимствует идею из двоичного классификатора!
источник