Существуют ли какие-либо документы / книги / идеи о взаимосвязи между количеством признаков и количеством наблюдений, которые необходимы для обучения «надежного» классификатора?
Например, предположим, что у меня есть 1000 объектов и 10 наблюдений из двух классов в качестве обучающего набора и 10 других наблюдений в качестве набора для тестирования. Я тренирую некоторый классификатор X, и он дает мне 90% чувствительности и 90% специфичности в тестовом наборе. Допустим, я доволен этой точностью и могу сказать, что это хороший классификатор. С другой стороны, я аппроксимировал функцию из 1000 переменных, используя только 10 точек, что может показаться не очень ... надежным?