Прогнозирование доверия нейронной сети

9

Предположим, я хочу обучить глубокую нейронную сеть выполнять классификацию или регрессию, но я хочу знать, насколько достоверным будет прогноз. Как я мог этого добиться?

Моя идея состоит в том, чтобы вычислить кросс-энтропию для каждого тренировочного материала, основываясь на его прогнозирующей способности в нейросчетчиках выше. Затем я подготовил бы вторую нейронную сеть для регрессии, которая взяла бы каждый элемент данных в качестве входных данных, а перекрестную энтропию - в качестве выходных данных (один выходной узел). Затем вы будете использовать обе сети на практике - одну для прогнозирования метки / значения, а другую для прогнозирования достоверности первой сети. (.... Но нужна ли мне тогда третья сеть для прогнозирования доверия ко второй сети и т. Д.?!)

Это правильная идея? Кроме того, это стандартная идея обычно используется? Если нет, что бы вы предложили?

Karnivaurus
источник
Прогнозные значения можно интерпретировать как достоверность.
yasin.yazici
Возможно, вы можете использовать метод начальной загрузки, реплицируя вашу модель на n выборок и создавая оценку дисперсии и, возможно, доверительный интервал для своих прогнозов.
Д.Кастро
Для классификации, как ответили некоторые, вероятности сами по себе являются мерилом вашей уверенности. Для регрессии мой ответ на очень похожий вопрос может оказаться полезным.
этно
1
Смотрите мой ответ на аналогичный вопрос здесь stats.stackexchange.com/a/247568/56940
Utobi

Ответы:

2

Возможно, я неправильно понимаю вопрос, но для классификации мне кажется, что стандартным способом является наличие выходного нейрона для каждого из Nклассов.

Тогда Nвектор [0, 1]выходных значений представляет вероятность входных данных, принадлежащих каждому классу, и поэтому может быть интерпретирован как «достоверность», которую вы хотите получить.

giorgiosironi
источник
[0,1]
2

Для тех, кто интересуется оценкой достоверности прогноза NN, вы можете взглянуть на Dropout как байесовское приближение: представление неопределенности модели в глубоком обучении (Gal et al., 2016) . Вкратце, он демонстрирует, как дисперсия предсказаний сети с выпадением по совокупности прогонов, в которых выполняется отсев, может использоваться для оценки достоверности предсказания. Этот подход может использоваться для сетей, предназначенных для классификации или регрессии.

lebedov
источник