Мне было интересно, есть ли какие-либо методы машинного обучения (без присмотра) для моделирования продольных данных? Я всегда использовал модели со смешанными эффектами (в основном нелинейные), но мне было интересно, есть ли другие способы сделать это (используя машинное обучение).
Под машинным обучением я подразумеваю случайный лес, классификацию / кластеризацию, деревья решений и даже глубокое обучение и т. Д.
machine-learning
mixed-model
John_dydx
источник
источник
Ответы:
В случае, когда имеется несколько наблюдений от одного субъекта (например, несколько посещений от одного и того же пациента), тогда «идентификатор пациента» является переменной «группировки». Необходимо соблюдать осторожность во время оценки модели, чтобы посещения одного и того же пациента не отображались в данных как обучения, так и тестирования, поскольку они коррелируют и приведут к повышению точности классификатора .
Документация sklearn для перекрестной проверки содержит итераторы перекрестной проверки для сгруппированных данных. Смотрите GroupKFold , LeaveOneGroupOut и LeavePGroupsOut .
Более того, попробуйте Рекуррентные нейронные сети или скрытые марковские модели .
источник
Вы можете смоделировать свой продольный с помощью стандартных методов машинного обучения, просто добавив функции, которые представляют продольность, например, добавив функцию, которая представляет время. Или функция, которая указывает членство в группе, человеке и т. Д. (В случае данных панели).
Если вы креативны с созданием / извлечением объектов, вы можете смоделировать все что угодно с помощью ML-алгоритмов
источник