RFM и моделирование ценности жизни клиента в R

12

Кто-нибудь может сказать мне, как сделать моделирование недавних событий, частоты и денежной стоимости (RFM) и моделирование потребительской ценности в R?

Кроме того, кто-нибудь может направить мне немного литературы об этом?

Бета
источник
1
Вы также можете посмотреть на пакет BTYD в R. Или купить, пока не умрете пакет. Я думаю, что Брюс Харди является одним из авторов. Не слишком уверен, хотя.

Ответы:

10

Что касается ссылок, интеллектуальный анализ данных с использованием анализа RFM должен помочь, насколько терминология и дальнейшие ссылки идут.

Одним из самых простых (и популярных) способов моделирования вероятности ответа клиента является использование логистической регрессии с RFM в качестве объясняющих переменных (среди других доступных переменных).

Для моделирования денежной стоимости можно было бы просто регрессировать доход от RFM напрямую (используя простую линейную модель для начинающих), что обычно на удивление хорошо. По моему опыту, более продвинутые / нелинейные модели (такие как Random Forest или Gradient Boosting Machine) работают лучше, чем линейные модели.

Другой популярный подход заключается в построении немного более сложной модели для прогнозирования денежной стоимости на основе двух подмоделей: одна для вероятности ответа (например, с использованием логистической регрессии как функции RFM), а другая для дохода, зависящая от ответа (опять же, это может быть так же просто, как линейная модель RFM). Ожидаемая денежная стоимость является продуктом двух прогнозов.

Если доступны рандомизированные данные испытаний / контроля, то методы, основанные на повышении / повышении нетто , достаточно популярны для моделирования дополнительных преимуществ лечения.

Что касается значения жизненного цикла клиента, см. Моделирование жизненного цикла клиента для обзора и дальнейших ссылок.

Что касается моделирования в R, мне не известны какие-либо "готовые" пакеты для этого типа моделирования. R действительно предоставляет все необходимые строительные блоки для этого (если у вас нет огромного количества данных - в этом случае вам, возможно, придется полагаться на более масштабируемые инструменты)

Евгений
источник
1
Очень хороший ответ, но я думаю, что первая ссылка может быть сломана.
Дмитрий Васильевич Мастеров
@ Евгений, у меня есть два вопроса относительно предложений, которые вы дали. Во-первых, что касается моделирования денежной стоимости, можно ли регрессировать доход, используя денежную единицу, среди переменных-предикторов? Боюсь, они будут совершенно одинаковыми переменными. Во-вторых, есть ли у вас онлайн-ресурсы, которые могли бы помочь мне понять, как проводить линейную регрессию с учетом ответа (используя второй подход, который вы описали)? Большое спасибо!
nhern121
1) Это нормально, если вы не путаете пояснительные / входные переменные (из прошлых данных) и целевую переменную (из «будущих» данных) 2) Просто выберите подмножество данных, в которых покупатели что-то купили, и регрессируйте доход на объясняющие переменные
Евгений
5

Не уверен, что вы все еще работаете над моделированием RFM. Здесь ( pdf ) есть статья / виньетка для пакета BTYD в R, которая может быть вам полезна. Вся статья основана на R и имеет 3 различных модели для просмотра. На странице 1, 2.1 Подготовка данных, вы можете увидеть контекст о RFM.

острый
источник
Спасибо Гунг! Хотя в настоящее время я не работаю над этим. Но это очень полезно. Кроме того, может быть полезным для других людей, которые работают над этим сейчас.
бета