Я читал статью « Глубокое остаточное обучение для распознавания изображений», и мне было трудно со 100% -ной уверенностью понять, что остаточный блок влечет за собой в вычислительном отношении. Читая их бумагу, у них есть рисунок 2:
который иллюстрирует то, что должен быть Остаточный Блок. Является ли вычисление остаточного блока просто таким же, как:
Или что-то еще?
Другими словами, возможно, чтобы попытаться сопоставить обозначения бумаги, это:
это правда?
Обратите внимание, что после суммирования по окружности на бумаге появляется слово ReLU, поэтому вывод остаточного блока (который я обозначил ) должен быть:
с одной дополнительной нелинейностью ReLU .
Ответы:
Да, это правда, вы можете взглянуть на их модель кафе, чтобы увидеть, как она реализована.
источник