Значение нейронной сети как черного ящика?

19

Я часто слышу, как люди говорят о нейронных сетях, как о чёрном ящике, который вы не понимаете, что он делает или что они значат. Я на самом деле не могу понять, что они имеют в виду под этим! Если вы понимаете, как работает обратное распространение, то как это черный ящик?

Они имеют в виду, что мы не понимаем, как были рассчитаны веса или что?

Джек Твен
источник
1
Может быть, это поможет: colah.github.io/posts/2014-03-NN-Manifolds-Topology В этой статье делается попытка раскрыть основной механизм нейронных сетей с топологической точки зрения, она предлагает много блестящих идей, чтобы объяснить производительность нейронные сети.
Соль
Я хотел бы добавить точку к Джеку, когда мы смотрим на MLP с точки зрения машинного обучения, нейронные сети больше не являются черным ящиком. С помощью простой сигмоидальной функции мы сможем интерпретировать входную и выходную связь с помощью уравнения.

Ответы:

37

Нейронная сеть - это черный ящик в том смысле, что, хотя она может аппроксимировать любую функцию, изучение ее структуры не даст вам понимания структуры аппроксимируемой функции.

Например, одним из распространенных применений нейронных сетей в банковском бизнесе является классификация заемщиков по категориям «хорошие плательщики» и «плохие плательщики». У вас есть матрица входных характеристик (пол, возраст, доход и т. Д.) И вектор результатов («по умолчанию», «не по умолчанию» и т. Д.). Когда вы моделируете это с помощью нейронной сети, вы предполагаете, что существует функция в собственном смысле математической функции. Эта функция f может быть произвольно сложной и может меняться в зависимости от развития бизнеса, поэтому вы не можете получить ее вручную.Сре(С)знак равнор

Затем вы используете нейронную сеть для построения приближения с частотой ошибок, приемлемой для вашего приложения. Это работает, и точность может быть сколь угодно малой - вы можете расширить сеть, настроить параметры обучения и получать больше данных, пока точность не достигнет ваших целей.е

Проблема черного ящика: приближение, данное нейронной сетью, не даст вам никакого представления о форме f. Не существует простой связи между весами и аппроксимируемой функцией. Даже анализ того, какая входная характеристика не имеет значения, является открытой проблемой (см. Эту ссылку ).

Кроме того, с традиционной точки зрения статистики нейронная сеть является неидентифицируемой моделью: учитывая набор данных и топологию сети, могут быть две нейронные сети с разными весами и одинаковым результатом. Это делает анализ очень сложным.

В качестве примера «моделей не черного ящика» или «интерпретируемых моделей» у вас есть уравнения регрессии и деревья решений. Первый дает вам приближенную форму f для замкнутой формы, где важность каждого элемента является явной, второй представляет собой графическое описание некоторых относительных соотношений рисков и шансов.

Лукас Галлиндо
источник
Поскольку это старый ответ, некоторым может быть полезно предоставить некоторые недавно разработанные инструменты: «Приближение, данное нейронной сетью, не даст вам никакого представления о форме f» - я бы сказал, что SHAP теперь выполняет отличная работа по объяснению модели, даже для нейронных сетей. «Даже анализ того, какая входная характеристика не имеет значения, является открытой проблемой» - такие методы, как важность перестановки, а также SHAP, теперь решают эту проблему довольно хорошо.
Бобсон Дугнутт
3

Google опубликовал Inception-v3 . Это нейронная сеть (NN) для алгоритма классификации изображений (рассказывает кошку от собаки).

В статье говорится о текущем состоянии классификации изображений

Например, GoogleNet использовал только 5 миллионов параметров, что в 12 раз меньше по сравнению с его предшественником AlexNet, который использовал 60 миллионов параметров. Кроме того, VGGNet использовал примерно в 3 раза больше параметров, чем AlexNet.

и именно поэтому мы называем NN для черных ящиков. Если я обучу модель классификации изображений - с 10 миллионами параметров - и передам ее вам. Что ты можешь сделать с этим?

Вы, конечно, можете запустить его и классифицировать изображения. Это будет отлично работать! Но вы не можете ответить ни на один из следующих вопросов, изучив все веса, уклоны и структуру сети.

  • Может ли эта сеть отличить лайку от пуделя?
  • Какие объекты легко классифицировать по алгоритму, какие сложно?
  • Какая часть собаки наиболее важна для ее правильной классификации? Хвост или нога?
  • Если я делаю фотошоп с головой кошки на собаку, что происходит и почему?

Вы можете ответить на вопросы, просто запустив NN и увидев результат (черный ящик), но у вас нет никаких изменений в понимании того, почему он ведет себя так, как в крайних случаях.

bottiger
источник
Я думаю, что, по крайней мере, один из вопросов («Какая часть собаки является наиболее важной для правильной классификации? Хвост или нога?») Вполне отвечает, если вы посмотрите статью и видео Мэтта Цейлера о деконволюции. сети
Алекс