Этот вопрос может идти здесь или на ТАК, возможно ...
Предположим, что ваш обучающий набор данных содержит как категориальные, так и непрерывные данные, такие как эта настройка:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
И зависимая переменная, которая будет предсказана, является ежегодной стоимостью ветеринара. Я немного сбит с толку относительно конкретных методов, доступных для работы с таким набором данных. Какие методы обычно используются для обработки наборов данных, представляющих собой смесь как непрерывных, так и категориальных данных?
источник
Вы должны взглянуть на предварительную обработку данных . Это до любой техники машинного обучения. Вот хорошее введение (найдено в Google).
Что касается методов, есть много разных подходов . Вероятно, вы сможете использовать большинство из них после предварительной обработки ваших данных. Вы должны попробовать их и выбрать тот, который наилучшим образом соответствует вашим потребностям.
источник