В контексте машинного обучения я часто видел термин « Основополагающая истина» . Я много искал и нашел следующее определение в Википедии :
В машинном обучении термин «наземная истина» относится к точности классификации учебного набора для контролируемых методов обучения. Это используется в статистических моделях для подтверждения или опровержения гипотез исследования. Термин «наземное обучение» относится к процессу сбора надлежащих объективных (доказуемых) данных для этого теста. Сравните с золотым стандартом.
Байесовская фильтрация спама является распространенным примером контролируемого обучения. В этой системе алгоритм обучается вручную разнице между спамом и не спамом. Это зависит от основополагающей правды сообщений, используемых для обучения алгоритма - неточности в основополагающей истине будут коррелировать с неточностями в результирующих вердиктах о спаме / не спаме.
Дело в том, что я действительно не могу понять, что это значит. Это метка, используемая для каждого объекта данных или целевой функции, которая присваивает метку каждому объекту данных , или, может быть, что-то еще?
Основная правда: это реальность, которую вы хотите, чтобы ваша модель предсказывала.
Он может иметь некоторый шум, но вы хотите, чтобы ваша модель изучала базовый шаблон в данных, который вызывает эту основную истину. Практически, ваша модель никогда не сможет предсказать основную правду, поскольку наземная истина также будет иметь некоторый шум, и ни одна модель не дает стопроцентной точности, но вы хотите, чтобы ваша модель была как можно ближе.
источник