Я даже не уверен, что этот вопрос имеет большой смысл, но я думаю, что видел пару названий статей, в которых предлагался случайный лес со случайными эффектами. Это возможно в R?
r
random-forest
random-effects-model
mguzmann
источник
источник
Ответы:
Они обычно не используются вместе, и следует соблюдать осторожность, прежде чем объединять их.
Случайные леса обычно используются в качестве классификаторов. Причина, по которой вы будете использовать случайный лес вместо другого метода (например, кластеризация K-средних), заключается в том, что у вас может быть большое количество измерений, по которым вы хотите классифицировать. Проблема с большим количеством измерений состоит в том, что если вы хотите протестировать все комбинации порядков измерений, у вас будет большое количество вариантов выбора (он растет быстрее, чем факториальное число измерений).
Случайные эффекты обычно используются в регрессии с повторными измерениями одного и того же. Они обычно используются в моделях смешанных эффектов, где термин смешанный относится как к фиксированным, так и к случайным эффектам. Считается, что фиксированные эффекты представляют параметры, которые вы увидите снова (например, лекарство или возраст человека). Считается, что случайные эффекты представляют собой случай изменчивости вокруг параметра, который вы больше не увидите (например, конкретного человека).
Есть примеры их совместного использования, когда есть кластеризованные данные http://dx.doi.org/10.1080/00949655.2012.741599 и http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf. ,
Я не знаю каких-либо пакетов R, которые могут сделать этот анализ.
источник
Да, это возможно. Вы должны проверить « Деревья RE-EM: подход интеллектуального анализа данных для продольных и кластерных данных » и связанный с ним пакет R REmtree .
Прошло много времени с тех пор, как я посмотрел на газету. Я помню, что авторы еще не пытались сформировать ансамбли этих деревьев, но ничто не предполагало, что это не сработает.
источник
Смешанные эффекты Случайные леса (MERFs) - вещь. Как говорится в ответе выше, группа доктора Ларока из HEC Montreal провела несколько исследований о них. Документ находится здесь: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
По сути, это теоретически обоснованный способ сочетания нелинейного моделирования случайных лесов с линейными случайными эффектами.
Мы только что выпустили пакет с открытым исходным кодом в Python, реализующий MERF с использованием приведенного выше алгоритма в статье.
Мы написали подробный пост в блоге о пакете и о том, как использовать его для кластерных наборов данных.
источник