Предположим, я строю прогностическую модель, в которой я пытаюсь предсказать несколько событий (например, бросок кубика и бросок монеты). Большинство известных мне алгоритмов работают только с одной целью, поэтому мне интересно, существует ли стандартный подход к такого рода вещам.
Я вижу два возможных варианта. Возможно, самым наивным подходом было бы просто рассматривать их как две разные проблемы, а затем объединять результаты. Однако это имеет серьезные недостатки, когда две цели не являются независимыми (и во многих случаях они могут сильно зависеть).
Более разумным подходом для меня было бы создание комбинированного целевого атрибута. Таким образом, в случае кристалла и монеты у нас будет состояний ( и т. Д.). Однако это может привести к довольно быстрому увеличению количества состояний / классов в составной цели (что если бы у нас было 2 кубика и т. Д.). Кроме того, это кажется странным в том случае, если один атрибут является категориальным, а другой - числовым (например, при прогнозировании температуры и типа осадков).
Есть ли стандартный подход к такого рода вещам? В качестве альтернативы, есть ли алгоритмы обучения, разработанные специально для этого?
источник
Ответы:
Это известно в сообществе машинного обучения как «Multi-Label Learning». Существуют различные подходы к проблеме, в том числе те, которые вы описываете в своем вопросе. Некоторые ресурсы для начала:
источник
Если у вас есть две переменные с одинаковыми предикторами, а переменная B также имеет переменную A в качестве предиктора, вы, возможно, смотрите на проблему оптимизации, где вы хотите оптимизировать оценки A и B одновременно. Нет смысла оптимизировать один, если вы получите плохую оценку для второго.
Это было бы проблемой исследования операций, и, к сожалению, за пределами моей компетенции.
источник