Сколько примеров обучения слишком мало при обучении нейронной сети?

Я новичок, пытающийся собрать свой первый проект. Я имел в виду проект классификации песен, но, поскольку я буду маркировать вручную, я смог собрать всего около 1000 песен или 60 часов музыки.

Я бы классифицировал по нескольким классам, так что вполне возможно, что в одном классе будет всего 50-100 песен в тренировочном наборе - кажется, это слишком мало! Существует ли общее правило, какое количество данных необходимо для обучения нейронной сети, чтобы дать ей шанс на работу?

Редактировать: я думал об использовании ванильного LSTM. Входные объекты будут иметь измерение 39, выходное измерение 6, моя первая попытка скрытого измерения слоя будет 100.

neural-networks Аррей
источник

Это не совсем ответственно, потому что не все задачи просты, и разные сетевые архитектуры и выбор гиперпараметров по-разному улучшат / повредят разные модели.

Sycorax говорит восстановить Монику

Как минимум, вам необходимо указать структуру вашей сети и количество ссылок для обучения.

gung - Восстановить Монику

Ответы:

Это действительно зависит от вашего набора данных и сетевой архитектуры. Одно практическое правило, которое я прочитал (2), было несколько тысяч образцов на класс, чтобы нейронная сеть начала работать очень хорошо.

На практике люди пытаются и видят. Нередко можно найти исследования, показывающие достойные результаты с обучающим набором, меньшим 1000 образцов.

Хороший способ приблизительной оценки того, в какой степени было бы полезно иметь больше обучающих образцов, состоит в построении графика производительности нейронной сети на основе размера обучающего набора, например, из (1):

(1) Дернонкур, Франк, Джи Янг Ли, Озлем Узунер и Питер Соловиц. « Распознавание записей пациента с помощью рекуррентных нейронных сетей ». Препринт arXiv arXiv: 1606.03475 (2016).
(2) Сирешан, Дан С., Ули Мейер и Юрген Шмидхубер. «Передача обучения для латинских и китайских символов с глубокими нейронными сетями». В 2012 году Международная совместная конференция по нейронным сетям (IJCNN), с. 1-6. IEEE, 2012. https://scholar.google.com/scholar?cluster=7452424507909578812&hl=ru&as_sdt=0,22 ; http://people.idsia.ch/~ciresan/data/ijcnn2012_v9.pdf :

Для задач классификации с несколькими тысячами образцов в классе , преимущество (без присмотра или под надзором) предварительной подготовки не так легко продемонстрировать.

Франк Дернонкур
источник