RFMでは捕捉できない消費者の異質性 ~クランピネスの導入~
RFM指標
マーケティングにおける代表的なメトリクスとして、Recency/Frequency/Monetaryの3つ、いわゆるRFM指標がある。 RFM指標で顧客のロイヤリティセグメンテーションしたり、色々と調理している人も多いと思う。 ただし、RFMはあくまでも結果指標なので、RFMをベースにあれこれ打ち手を考えるのは避けるべき*1。
RFM指標では捕捉しきれない異質性
さてさて、タイトルの回収だが、RFMでは捕捉しきれない場合がある。たとえば
みたいなケース。RF指標は同じであっても、習慣性や購買間隔が異なる場合がある。ECサイトで言えば、定期的に購入するユーザーと、たまにまとめ買いするユーザーが同じセグメントになってしまう。マーケターからすると、彼らには異なるアプローチをしたいはずである。
そこで、RFMに加えてClumpiness指標というものが提案されているらしい。元論文はこれ Zhang, Bradlow & Small(2015)。 Clumpiness=不均一性みたいな訳になっているが、個人的には行動の「ムラ」だと思うとしっくりくる。
諸々すっ飛ばして、その定義式だけ見てみると、要するにエントロピーだなこれは。
Clumpinessを使った分析例
Clumpiness指標をマーケティング実務応用する論文として、
を読んだ。Clumpinessを使って、購買や離反に対する知見獲得を試みている。ポケモンGOを題材に解析をしている。
離反傾向の分析として、生存時間分析を実施していた。結果はこんな感じ
論文から引用すると、
長期的な優良ユーザの育成のため に必ずしも単なる高頻度の利用が有利に働くわけでは ないことを示しており,同一の利用頻度でもその利用 パターンに顧客の離脱までの期間が影響を受けるこ とを意味している.このように,初期の利用履歴デー タから離脱する確率の高いユーザのみを早期に発見 可能であるという点で,従来の RFM 分析に加えて Clumpiness を考慮することはマーケティング戦略上 重要であるといえる.
ということらしい。やはり同じようなFrequencyであっても、行動に「ムラ」があるユーザーは離反傾向が強いとのことで納得感がある。 彼らも論文中で「熱しやすく冷めやすいユーザー」と表現している。
機会があったら実務でも検討してみよう
*1:ロイヤルな顧客はFrequencyが高い!顧客全員のFrequencyをあげよう!!みたいな情報量0なメッセージになる
線形回帰では、何をしたいか?が重要
実務では線形回帰ばかりを使っているのに、きちんと勉強したことないのでいろいろと調べてた。
Twitterで観測する強い方達は大体佐和本を薦めてる。これを読め!!って話なんだろうけど、きちんと読んだ人どれくらいいるのだろう。。私には敷居が高かった。
ネットサーフィンしてたら素敵な記事を発見。
線形回帰って、予測の文脈でも出てくるし効果検証の文脈でも出てくるしよくわからない状態だったのだけど、この記事でかなり頭の中が整理された。 線形回帰はもちろん同じ式の形をしているのだが、使う目的によって解釈が違ってくるという話が丁寧にされていた。
つまり、全く同じ見た目をしていても、
- 関連の探索がしたいのか?
- 因果の証明がしたいのか?
- とにかく予測がしたいのか?
によって解釈が異なるということ。よくある間違いが、関連の探索をそのまま因果だと信じて意思決定することだと思う。 でも因果の証明って結構難しい*1よなぁ。ちなみにこの辺の、線形回帰で因果推論する話はこちらの本に詳しい。
重回帰が満たすべき仮定について、これでもかというほど丁寧に解説しているので、実務で線形回帰する人は必読かなと*2。
- 多重共線性ってなんとなくダメなんだよね?
- VIF > 10の説明変数を削除すればいいんでしょ?
くらいの知識だったら、逃げずに1回高橋先生のこの本は読んだ方がいいと思う。直近で因果推論が必要なくても、線形回帰の本だと思って前半読めば良い。後半は因果推論に特化してくる。
実務家がどう線形回帰(+ 一般化線形回帰)を使ってるのか興味があって調べてたら、こんな本も見つけた
洋書だし500ページ以上あるし今読むのは厳しいかなぁ。GelmanってBDAの著者でもあるのか。*3
Push配信最適化 ~SmartNews~
SmartNewsのPUSH配信最適化に関する記事を読んだのでメモ
Take aways
- Push配信回数が多いほうが短期的に(2週間程度)Engagement指標(DAUなど)がControlに比べてリフトした
- しかし長期的(6ヶ月程度)に見るとチャーン等が発生しControlに負ける結果となった
- 基礎分析の結果以下がわかった
- Existing usersとNew usersで異なる反応を示しており、New usersは特にPush配信を増やしたときのNegative Impactが大きかった
- Existing usersは長期間サービスを利用しているユーザーであり生存バイアスが働いていると推察できる
- 一方New usersはサービスの使い始めなので、あらゆるpushにnoticeableかつsensitiveになっている
- 以上の基礎分析から、登録日の長さに比例するようにPUSH配信をaddaptiveに増やす戦略を実施した
- よりone-to-oneな世界にするため、short/long-termリフトをミックスしたValue functionを目的関数としてMLモデルの構築をし、Engagement指標の15%リフトを達成した
感想
こういうlong-termにTreat/Controlの比較ができる環境って案外難しい。
社内全体を巻き込んでUniversal Controlを置いたり、他のチームのTreatmentになったとしてもランダム割り付けであるか保証したり、諸々大変そう。でもこういう会社全体でのA/Bテストデザインって勉強したことないな。
プロモーションと価格弾力性
クーポン配布や値下げのような価格プロモーションの影響についてざっくり調べた備忘録です。
読んだもの(順番てきとう)
- マーケティングサイエンス入門(有斐閣アルマ)
- The long-term impact of promotion and advertising on consumer brand choice(1997)
- 本橋永至, 樋口知之. 市場構造の変化を考慮したブランド選択モデルによる購買履歴データの解析. マーケティング・サイエンス, Vol. 21, No. 1, pp. 37–59, 2013.
- Cents or Percent? The Effects of Promotion Framing on Price Expectations and Choice(2007)
それぞれの簡単なメモ書き
マーケティングサイエンス入門
第8章がプロモーションについて書かれていてとてもわかりやすい。プロモーションでは付き物な、需要の先喰いや先延ばしにも触れられている。 この本で紹介されていたGupta(1988)では、プロモーション効果分析モデルとしてロジットモデルによるブランド選択モデルと同時に、購買タイミングと購買量も同時確率としてモデリングしているらしい(1988年にそんなてんこ盛りモデル動いたんだろうか。。。)
複数ブランドのコーヒーの購買データを分析した結果、プロモーションによる売上増分の84%がブランドスイッチ、14%が購買間隔の短縮、2%が購買量の増加とのこと。ほとんどブランドスイッチなのね。購買間隔とか購買量はさっき出てきた先喰いのせいかもしれないから慎重に判断とのこと。 プロモーションってほとんど新規顧客獲得の為なのかも。アップセルをプロモーションで行おうと思っても難しいってことか。
The long-term impact of promotion and advertising on consumer brand choice(1997)
1997年の論文。ML系のカンファレンスペーパーを追っかけてる人からすると古の論文なんだろうな(私も古いと思ってしまった)。ちなみにさっきのGupta(1988)と同じ人がセカンドオーサーになっている。 これはプロモーションだけではなく、広告が与える影響についても分析したもので、1500世帯の8年間に渡るパネルデータを使っていた。商材は家事に関する消費財なのかな?(商品名は明かせません、みたいに書いてる。英語あってるはず)
広告とプロモーションが長期的なブランド選択に与える影響なんだけど、広告は価格・プロモ弾力性を下げるがプロモーションは上げてしまうらしい。特にnon-Loyalの方がLoyalに比べて影響を受けやすかったとのこと。これは直感的にも納得がいく。広告での刷り込まれてたら、高い・安いではなくブランドで選んでもらえる。一方で、何度もプロモーションもらってたら、プロモーションなしでは動かないユーザーになってしまう。Udemyとか、数万円する講座がたまに2000円くらいになってるけど、あれ平常時に購入する人いるんだろうか。。 それにしても、1997年にはこんな研究されてたなんて驚き。
これは最近のマーケティングサイエンスの論文でも感じるただのボヤキなのだが、使用データがスーパーの消費財ばっかりじゃない?カレールー、コーヒー、ケチャップなどなど。デジタルマーケだと、もっと突発的購買だったり、競合へのブランドスイッチ観測できなかったりするので難しい。あとそもそものデータサイズがスーパーデータとは桁違い。ID付きPOSは取りやすいけどね。そもそもそこまでビッグデータだったら階層ベイズとか言わずに、素直にML使えばいいんだろうか。ここには自分なりの解がない
市場構造の変化を考慮したブランド選択モデルによる購買履歴データの解析
あまりちゃんと読んでいないけど、状態空間モデルで価格弾力性の時間変化をモデリングしているっぽい。マーケティングサイエンスといえば、階層ベイズで消費者の異質性を取り込みがちだけど、十中八九今後の展望に「時間的異質性を考慮できるモデルへの拡張」って書いてある。でも実際パラメータの数増えすぎて大変そう*1
時変係数って基本ランダムウォークとして時間発展させるか、2階差分~0として滑らかさを付与するかってイメージだけど、前にUberがガウス過程で時変係数推定してるの思い出した。 Modeling Dynamic Heterogeneity Using Gaussian Processes。これもちゃんと読みたいなぁ
Cents or Percent? The Effects of Promotion Framing on Price Expectations and Choice(2007)
XX円OFFと、XX%OFFで消費者心理に与える影響ってどう違うの?という論文。
結論、XX円OFFよりもXX%OFFのほうが短期的リフトは望めるが、その後の顧客期待値(参照価格)が上がってしまい、値引きを辞めてしまうと客離れが起きやすくなってしまう。 典型的なプロモーション弾力性の上がった世界の出来上がりって感じかぁ。こういうプロモーション弾力性みたいな話すると、いつも前澤さんのお金配りを思い出す。