Я очень новичок в области глубокого обучения, и мне особенно интересно знать, что такое LSTM и BiLSTM и когда их использовать (основные области применения). Почему LSTM и BILSTM более популярны, чем RNN?
Можем ли мы использовать эти архитектуры глубокого обучения в неконтролируемых задачах?
machine-learning
deep-learning
rnn
lstm
Волька
источник
источник
Ответы:
RNN
Такие архитектуры, какLSTM
иBiLSTM
используются в случаях, когда проблема обучения является последовательной, например, у вас есть видео, и вы хотите знать, о чем идет речь, или вы хотите, чтобы агент прочитал для вас строку документа, которая является изображением текста и не в текстовом формате. Я настоятельно рекомендую вам взглянуть на здесь .LSTMs
и их двунаправленные варианты популярны, потому что они пытались узнать, как и когда забывать, а когда не использовать ворота в своей архитектуре. В предыдущихRNN
архитектурах исчезновение градиентов было большой проблемой и заставляло эти сети не учиться так много.Используя Двунаправленный
LSTMs
, вы вводите в алгоритм обучения исходные данные один раз от начала до конца и один раз от конца до начала. Здесь есть дебаты, но обычно они учатся быстрее, чем однонаправленный подход, хотя это зависит от задачи.Да, вы можете использовать их в обучении без учителя, в зависимости от вашей задачи. взгляните на здесь и здесь .
источник
Люди не начинают думать с нуля каждую секунду. Когда вы читаете это эссе, вы понимаете каждое слово на основе вашего понимания предыдущих слов. Вы не выбрасываете все и снова начинаете думать с нуля. Ваши мысли настойчивы.
Традиционные нейронные сети не могут этого сделать, и это кажется серьезным недостатком. Например, представьте, что вы хотите классифицировать, какое событие происходит в каждой точке фильма. Неясно, как традиционная нейронная сеть могла бы использовать свои рассуждения о предыдущих событиях в фильме для информирования более поздних.
Периодические нейронные сети решают эту проблему. Это сети с петлями в них, позволяющими сохранять информацию.
Для дальнейшего чтения этого перейдите в блог Коэна
источник
По сравнению с LSTM
BLSTM
илиBiLSTM
имеет две сети, однаpast
информация доступа вforward
направлении и другая доступfuture
вreverse
направлении. WIKIНовый класс
Bidirectional
добавлен в соответствии с официальным документом здесь :Полный пример с использованием данных IMDB будет таким
источник