Прогнозирование нескольких целей или классов?

12

Предположим, я строю прогностическую модель, в которой я пытаюсь предсказать несколько событий (например, бросок кубика и бросок монеты). Большинство известных мне алгоритмов работают только с одной целью, поэтому мне интересно, существует ли стандартный подход к такого рода вещам.

Я вижу два возможных варианта. Возможно, самым наивным подходом было бы просто рассматривать их как две разные проблемы, а затем объединять результаты. Однако это имеет серьезные недостатки, когда две цели не являются независимыми (и во многих случаях они могут сильно зависеть).

Более разумным подходом для меня было бы создание комбинированного целевого атрибута. Таким образом, в случае кристалла и монеты у нас будет состояний ( и т. Д.). Однако это может привести к довольно быстрому увеличению количества состояний / классов в составной цели (что если бы у нас было 2 кубика и т. Д.). Кроме того, это кажется странным в том случае, если один атрибут является категориальным, а другой - числовым (например, при прогнозировании температуры и типа осадков).62знак равно12(1,ЧАС),(1,T),(2,ЧАС)

Есть ли стандартный подход к такого рода вещам? В качестве альтернативы, есть ли алгоритмы обучения, разработанные специально для этого?

Майкл МакГоуэн
источник
Вы имеете в виду очень зависимым в конце вашего второго абзаца. Если да, задумывались ли вы о каком-либо подходе цепочки Маркова после оценки первой переменной?
Мишель
Ой, я действительно имел в виду зависимость и исправил это, спасибо. Я не рассматривал подход с цепью Маркова, и мне придется подумать, имеет ли это здесь смысл; Благодарю.
Майкл МакГоуэн

Ответы:

5

Это известно в сообществе машинного обучения как «Multi-Label Learning». Существуют различные подходы к проблеме, в том числе те, которые вы описываете в своем вопросе. Некоторые ресурсы для начала:

TDC
источник
0

Если у вас есть две переменные с одинаковыми предикторами, а переменная B также имеет переменную A в качестве предиктора, вы, возможно, смотрите на проблему оптимизации, где вы хотите оптимизировать оценки A и B одновременно. Нет смысла оптимизировать один, если вы получите плохую оценку для второго.

Это было бы проблемой исследования операций, и, к сожалению, за пределами моей компетенции.

Мишель
источник