Как всем известно, разработка функций чрезвычайно важна для машинного обучения, однако я нашел немного материалов, связанных с этой областью. Я участвовал в нескольких соревнованиях в Kaggle и считаю, что в некоторых случаях хорошие характеристики могут быть даже важнее, чем хороший классификатор. Кто-нибудь знает какие-либо учебники по проектированию функций, или это чистый опыт?
19
Ответы:
Я бы сказал, опыт - основные идеи:
источник
Есть книга О'Рейли под названием « Разработка функций для машинного обучения », написанная Zheng et al.
Я прочитал книгу, и она охватывает различные типы данных (например, категориальные, текстовые ...) и описывает различные аспекты разработки функций, которые сопровождают ее. Это включает в себя такие вещи, как нормализация данных, выбор функции, TF-IDF в тексте.
источник