こちらの記事の続編です。引き続き論文読んでいきます。

モデル概要

本論文で提案するモデルは、Schmittlein, Morrison, and Colombo(1987)で提案されたPrareto/NBDモデルをベースにしている。これはBTYDモデルの１つであり、BTYDには多くの研究や亜種が存在する。本論文では、非契約型サービスを対象としている。サブスクのように会員・非会員ステータスがはっきりしているサービスでは「離反状態」を観測できるが、そうではない一般的なECサイトの場合「離反状態」なのか「単に期間が空いてるだけ」なのかわからないので推定する必要がある。

BTYDの歴史について、こちらの記事によくまとまっていました。

retina.ai

提案モデルと先行研究との違いは、下表の通り。

階層ベイズ法により、共変量の導入が簡単であったり、パラメータ同士の相関関係を自然に表現できる柔軟性が確保できる。

仮定

提案モデルにおける仮定について整理する。

個々のカスタマーに対する仮定

購買率は、強度λのポアソン過程に従う
生存時間は、離反率μの指数分布に従う
購買額は、平均ηの対数正規分布に従う

仮定２の指数分布に関しては、こちらの論文にて仮定の妥当性について言及がある。

これは、離脱が過去の生存時間に関係なくランダムに起きるという無記憶性を意味する。この仮定の妥当性は、離脱が企業に対する飽き、競合企業への乗り換え、転居、死去などの様々な理由によって起きることと、一度購買が観測されるということは顧客の生存が確認されて離脱プロセスがリセットされる、という２点から支持される。

また、仮定３については経験的にガンマ分布等よりは対数正規分布の当てはまりが良いことから仮定しているそう。ただし、先行研究ではガンマ分布や正規分布による仮定が多い。