マーケティングサイエンス学習録

勉強したことをとりあえずここに集積していきます。

階層ベイズによるLTVモデリング:BTYDモデル(1)

最近業務でLTVをモデリングしたくなったので、今日はこちらの論文を読みました。 LTVモデリングとして、BTYD(Buy Till You Die)モデルが有名らしいですが、こちらの論文では自然に共変量を入れるべく階層ベイズ版BTYDを提案したものだそうです。

Deriving Customer Lifetime Value from RFM Measures: Insights into Customer Retention and Acquisition

アブスト

RFM指標を利用して、個人レベルでのLTVモデルを開発した。このモデルによって、購買率(purchase rate)・生存時間(lifetime)・購買額(spending)(まとめてPLSとも言うらしい)の特徴が個別のカスタマーに対して得られる。論文では、「誰に・いつ・何を」アクションすることでROIを向上できるか?についてRetention Programの観点から提案してくれるらしい。*1

イントロ

RFMはCRMにて非常に良く使われる指標だが、あくまで結果変数であることに注意が必要。個別のカスタマーにはそれぞれ特徴があるが、RFMはある1点で彼らのトランザクション状況を切り取った統計量に過ぎない。例えば、同じRFMであっても、より購買間隔の短い(衝動買い・まとめ買いの類)カスタマーの方が離反しやすく、LTVが異なるなどが考えられる。

Frequencyは購買率とは異なる概念であることも注意が必要。Frequencyは単に集計期間における購買回数であるが、LTVモデルで推定する購買率はP(# of 購買 | Alive)のように生存が前提となっている。

PLSに関する研究は多くされてきたが、各要素の相関関係には色々な説があるらしい。*2

各要素の相関関係がなぜ重要かというと、例えば頻繁に購買するカスタマーは単価が低い(負の相関)のような関係があった場合にCRMの観点から頻繁購買層を積極的に集客すべきか否か?という問いが発生するからであり、重要な意思決定となる。

この論文での貢献は3つ。

  1. RFMを活用した個人レベルのLTVモデルを提案した点
  2. LTVモデルを活用して、LTVを最大化するマーケティングプログラムのフレームを提案した点
  3. モグラなどの特徴量を入れ込むことで、見込み客のようなデータが存在しない*3場合でもLTV予測を可能とした点

提案モデルの概要図はこんな感じです。

つぎからモデルの詳細に入っていきます。疲れたので記事分けますmm

*1:これはマーケターの究極の問いですよね。

*2:文脈が違えば別におかしくないのでは?

*3:当然RFM特徴量も得られない