Я использую SVM для классификации и пытаюсь определить оптимальные параметры для линейных и RBF-ядер. Для линейного ядра я использую перекрестный проверенный выбор параметров, чтобы определить C, а для ядра RBF я использую поиск по сетке, чтобы определить C и гамму.
У меня есть 20 (числовых) функций и 70 учебных примеров, которые должны быть разбиты на 7 классов.
Какой диапазон поиска следует использовать для определения оптимальных значений параметров C и гамма?
Проверьте раздел 2.3.2 этого документа Chapelle и Zien. У них есть хорошая эвристика, чтобы выбрать хороший диапазон поиска для ядра RBF и C для SVM. я цитируюσ С
После этого они используют кратные (например , для к ∈ { - 2 , . . . , 2 } ) значения по умолчанию в качестве диапазона поиска в сетке-поиск с помощью кросс-проверки. Это всегда работало очень хорошо для меня.2К K ∈ { - 2 , . , , , 2 }
Конечно, мы @ciri сказали, что нормализация данных и т. Д. Всегда хорошая идея.
источник