線形回帰では、何をしたいか?が重要
実務では線形回帰ばかりを使っているのに、きちんと勉強したことないのでいろいろと調べてた。
Twitterで観測する強い方達は大体佐和本を薦めてる。これを読め!!って話なんだろうけど、きちんと読んだ人どれくらいいるのだろう。。私には敷居が高かった。
ネットサーフィンしてたら素敵な記事を発見。
線形回帰って、予測の文脈でも出てくるし効果検証の文脈でも出てくるしよくわからない状態だったのだけど、この記事でかなり頭の中が整理された。 線形回帰はもちろん同じ式の形をしているのだが、使う目的によって解釈が違ってくるという話が丁寧にされていた。
つまり、全く同じ見た目をしていても、
- 関連の探索がしたいのか?
- 因果の証明がしたいのか?
- とにかく予測がしたいのか?
によって解釈が異なるということ。よくある間違いが、関連の探索をそのまま因果だと信じて意思決定することだと思う。 でも因果の証明って結構難しい*1よなぁ。ちなみにこの辺の、線形回帰で因果推論する話はこちらの本に詳しい。
重回帰が満たすべき仮定について、これでもかというほど丁寧に解説しているので、実務で線形回帰する人は必読かなと*2。
- 多重共線性ってなんとなくダメなんだよね?
- VIF > 10の説明変数を削除すればいいんでしょ?
くらいの知識だったら、逃げずに1回高橋先生のこの本は読んだ方がいいと思う。直近で因果推論が必要なくても、線形回帰の本だと思って前半読めば良い。後半は因果推論に特化してくる。
実務家がどう線形回帰(+ 一般化線形回帰)を使ってるのか興味があって調べてたら、こんな本も見つけた
洋書だし500ページ以上あるし今読むのは厳しいかなぁ。GelmanってBDAの著者でもあるのか。*3