ロジスティック回帰は、人事データ分析の“入口”としてとても便利です。残業が多い、評価が低い、異動が多い、通勤が長い――こうした変数を入れれば、「辞めた人に多い特徴」や「辞めやすい人の傾向」はかなりの精度で見えてきます。ここで多くの人が「原因が分かった」と思ってしまいますが、実はそれは半分だけ正解です。ロジスティック回帰が教えてくれるのは、基本的に“相関”だからです。
相関の怖いところは、「当たって見えるのに、打ち手が外れる」ことです。たとえば「残業が多いほど退職が増える」という結果が出たとします。では残業を減らせば辞めなくなるのでしょうか。必ずしもそうとは言えません。部署が炎上している、上司のマネジメントが悪い、役割が曖昧で揉めている――こうした“共通の原因”が、残業も退職も同時に押し上げている可能性があるからです。この場合、残業は原因というより「炎上の症状」に近く、残業だけ減らしても根本原因が残れば退職は減らない、ということが起こり得ます。
ここで威力を発揮するのがDAG(因果ダイアグラム)です。DAGは「どの変数がどの変数に影響しているか」を矢印で描き、相関ではなく因果の筋道を固定します。ポイントは、回帰式そのものを賢くすることではありません。DAGによって「回帰に入れるべき変数」と「入れてはいけない変数」を決められることが価値です。例えば、原因の共通項(交絡)は調整すべきですが、施策の途中にある結果(媒介)をうっかり調整すると“施策の効き目”を自分で消してしまいます。また、複数要因の合流点(コライダー)を調整すると、存在しなかった関係を人工的に作ってしまうことがあります。ロジスティック回帰が「数字を出す装置」だとすれば、DAGは「数字の出し方を間違えないための設計図」です。
この設計図を持つと、「辞める人の特徴」から一歩進んで、「何を変えれば辞めにくくなるか」という問いに近づけます。たとえば介入を一つ定義します。残業削減、1on1頻度の増加、配置転換、役割の明確化、評価の透明性向上――どれでも構いません。次にDAGで、その介入が退職に届く経路と、同時に介入にも退職にも影響する交絡要因を整理します。最後に、その設計図に従ってロジスティック回帰(または時系列なら離散時間ハザード)を組めば、「介入した場合に退職確率がどれだけ変わる見込みか」という“打ち手の推定”に変わります。つまり、分析の成果が「当てる」から「動かす」へ変わるのです。
もちろん、DAGを描けば魔法のように正解が出るわけではありません。観測できない要因は残りますし、退職は確率現象なので個人を確定的にコントロールすることもできません。それでも、ロジスティック回帰だけで陥りがちな「相関を原因と誤認し、施策が外れる」という失敗は大きく減らせます。人事データ分析に求められるのは、説明のうまさではなく、現場で再現される意思決定です。その意味で、DAGは“分析を意思決定の道具に変える”ための、最も費用対効果の高い追加パーツだと言えます。
退職分析をやるなら、まずロジスティック回帰で地形図を描く。そして「どうすれば辞めないか」を知りたいなら、DAGで戦場のルールを固定する。相関の地形図に、因果の設計図を重ねたとき、分析は初めて“実行可能な戦略”になります。
