Я изучаю машинное обучение, и я хотел бы знать, как рассчитать VC-измерение.
Например:
, с параметрами .
Каково его VC-измерение?
Я изучаю машинное обучение, и я хотел бы знать, как рассчитать VC-измерение.
Например:
, с параметрами .
Каково его VC-измерение?
Измерение VC является оценкой возможностей двоичного классификатора. Если вы можете найти набор из точек, чтобы он мог быть разбит классификатором (т.е. правильно классифицировать все возможные 2 n маркировок), и вы не можете найти ни одного набора из n + 1 точек, которые можно разбить (т.е. для любого набора из n + 1 балл, есть хотя бы один порядок маркировки, чтобы классификатор не мог правильно разделить все точки), тогда размерность VC равна n .
В вашем случае сначала рассмотрим две точки и x 2 , такие что x 1 < x 2 . Тогда есть 2 2 = 4 возможных маркировки
Все маркировки могут быть достигнуты с помощью классификатора путем установки параметров a < b ∈ R таким образом, чтобы
соответственно. (На самом деле, можно считать wlog, но этого достаточно, чтобы найти один набор, который можно разбить.)
Теперь рассмотрим три произвольных (!) Точки , x 2 , x 3 и предположим, что x 1 < x 2 < x 3 , тогда вы не сможете добиться маркировки (1,0,1). Как и в случае 3 выше, метки x 1 : 1 и x 2 : 0 означают a < x 1 < b < x 2 . Что подразумевает x 3 > b и, следовательно, метку x 3 должно быть 0. Таким образом, классификатор не может разбить любой набор из трех точек, и, следовательно, размерность VC равна 2.
-
Может быть, это станет понятнее с помощью более полезного классификатора. Давайте рассмотрим гиперплоскости (т.е. линии в 2D).
Легко найти набор из трех точек, которые можно классифицировать правильно, независимо от того, как они помечены:
Для всех возможных маркировок мы можем найти гиперплоскость, которая идеально их разделяет.
Однако мы не можем найти какой-либо набор из 4 точек, чтобы мы могли правильно классифицировать все возможных обозначений. Вместо формального доказательства я пытаюсь представить визуальный аргумент:
Предположим пока, что 4 точки образуют фигуру с 4 сторонами. Тогда невозможно найти гиперплоскость, которая может правильно разделить точки, если мы пометим противоположные углы одинаковыми метками:
Если они не образуют фигуру с четырьмя сторонами, существует два «граничных случая»: «внешние» точки должны либо образовывать треугольник, либо все они должны образовывать прямую линию. В случае треугольника легко увидеть, что маркировка, в которой «внутренняя» точка (или точка между двумя углами) помечена как отличная от других, не может быть достигнута:
В случае отрезка применяется та же идея. Если конечные точки помечены не так, как другие, они не могут быть разделены гиперплоскостью.
Поскольку мы рассмотрели все возможные формации из 4 точек в 2D, мы можем заключить, что нет 4 точек, которые можно разбить. Следовательно, размер VC должен быть 3.
Измерение VC классификатора определяется следующим образом:
Таким образом, должен быть только один способ размещения трех точек так, чтобы все возможные распределения классов среди этого размещения точек были классифицированы правильным образом.
Если вы не разместите три точки на линии, восприятие будет правильным. Но нет способа заставить восприятие классифицировать все возможные распределения классов по 4 баллам, независимо от того, как вы расставили баллы
Ваш пример
VC-Dimension 2: он может правильно классифицировать все четыре ситуации.
VC-Dimension 3: Нет, это не работает. Представьте себе классы
true
иfalse
порядок какTrue False True
. Ваш классификатор не может справиться с этим. Следовательно, он имеет VC-размерность 2.доказательство
источник