У меня есть вопрос, касающийся процесса перекрестной проверки. Я нахожусь в середине курса машинного обучения на Cursera. Одна из тем - о перекрестной проверке. Мне было немного трудно следовать. Я знаю, почему нам нужно CV, потому что мы хотим, чтобы наши модели хорошо работали с будущими (неизвестными) данными, а CV предотвращает переоснащение. Однако сам процесс сбивает с толку.
Я понял, что я разбил данные на 3 подмножества: обучение, проверка и тестирование. Обучать и проверять, чтобы найти оптимальную сложность модели. Что я не понимаю, так это третье подмножество. Я понимаю, что беру ряд функций для модели, обучаю ее и проверяю ее в подмножестве проверки и ищу функцию минимальных затрат при изменении структуры. Когда я нашел его, я тестирую модель на подмножестве тестов. Если я уже нашел функцию минимальной стоимости в подмножестве проверки, зачем мне снова проверять ее в подмножестве проверки ???
Может ли кто-нибудь уточнить это для меня?
Спасибо
Ответы:
источник
Из-за случайной ошибки: Обычно у вас есть только конечное число случаев.
Оптимизация производительности валидации (внутреннего теста) означает, что вы можете использовать этот внутренний тестовый набор. Внутренний набор тестов способствует оценке окончательной модели и, таким образом, не зависит от модели.
Это означает, что вам нужно иметь другой (внешний) набор тестов, который не зависит от всей процедуры моделирования (включая все процессы предварительной обработки и оптимизации на основе данных или выбора модели), если вы хотите оценить свойства обобщения.
Я рекомендую вам сделать симуляцию и сравнить три различные оценки ошибок, которые вы можете иметь
МЕРЫ Совершенство-о-приступе
В симуляции вы можете легко сравнить их с правильным, большим, независимо сгенерированным набором тестов. Если установка правильная, внешний тест должен быть беспристрастным (по сравнению с суррогатной моделью, которую он оценивает, а не по «окончательной» модели, построенной на всем наборе данных). Внутренний тест обычно смещен оптимистично, а повторное замещение еще более смещено оптимистично.
В моей области внутренний тест легко недооценил бы ошибку обобщения в 2 - 5 раз (намного больше для агрессивных схем оптимизации).
Примечание: номенклатура множеств не является универсальной. В моей области (аналитическая химия) валидация обычно означает подтверждение эффективности последней процедуры - таким образом, больше того, что делает ваш «тестовый» набор, чем то, что делает ваш «тестовый» набор.
Поэтому я предпочитаю говорить о внутренних и внешних наборах тестов или о наборе тестов оптимизации (= внутреннем наборе тестов), и тогда набор валидации будет означать внешний набор тестов.
источник
При обучении модели необходимо выбирать мета-параметры для модели (например, параметр регуляризации) или даже выбирать из нескольких моделей. В этом случае подмножество проверки используется для выбора параметра, но подмножество проверки для окончательной оценки прогноза.
источник