В настоящее время я пытаюсь реализовать некоторые алгоритмы машинного обучения самостоятельно. Многие из них обладают неприятным свойством трудной отладки, некоторые ошибки не приводят к сбою программы, а скорее работают не так, как задумано, и кажется, что алгоритмы просто дают более слабые результаты.
Я бы хотел повысить уверенность в реализации, например, если бы у меня было несколько небольших наборов данных с дополнительной информацией «Алгоритмы X работали для Y итераций и имели результаты Z для этого набора данных», что было бы очень полезно. Кто-нибудь слышал о таких наборах данных?
Ответы:
Из хранилища машинного обучения UC Irvine :
Кроме того, следующий набор данных MIAS был широко использован и изучен:
источник
Репозиторий UCI, упомянутый Башаром, вероятно, является самым большим, тем не менее я хотел добавить пару небольших коллекций, с которыми я столкнулся:
источник