従来、0か1か、有るか無ないか、陽性か陰性か、のようなバイナリデータの解析は「差があるか、ないか」で終わりがちでした。こうしたデータに対しては、Fisher検定やカイ二乗検定で p値を見て、「有意でした」で結論づけるのが一般的です。もちろんそれ自体は重要です。しかし、現場で本当に知りたいのは、そこから先ではないでしょうか。

たとえば、単独では有意に見えない項目でも、複数が同時に崩れることで初めて意味を持つことがあります。ある項目群は早期から一気に低下し、別の項目群は最後まで安定して残る。さらに左右で崩れ方が違う。こうした“崩れ方の並び”や“連動の仕方”は、単変量の有意差検定だけでは見えません。

分布構造分析と因果推論モデル(DSA+DAG)によるバイナリデータ解析では、従来法では「一部項目の有意差」に留まっていたところから、急落する項目のセット、安定クラスター、段階的悪化、左右非対称性、さらに直接効果と間接効果の違いまで抽出できました。つまり、0/1データでも「差」ではなく「構造」が読めるのです。 重要なのは、DSA+DAGが“バイナリデータでも多変量の構造情報を捨てない”という点です。従来法が「どの項目が有意か」を答えるのに対し、DSAは「どの項目が似た動きをするか」「どの段階で崩れるか」「全体の分布構造はどう変わるか」を捉え、DAGはそれを因果の流れとして整理します。 結果として、単なる検定結果の羅列ではなく、「何が先に崩れ、何が代償し、何が最後に残るのか」という現象の地図が得られます。実際、内部レポートでも、従来手法では限定的だった知見に対し、DSA+DAGではクラスター構造、段階的悪化、構造的偏差、因果経路の区別といった付加価値が確認されました。 これは医療に限った話ではありません。営業なら「買った/買わない」、人事なら「離職した/しない」、製造なら「異常あり/なし」、マーケティングなら「反応した/しない」。多くの実務データは、実はバイナリです。にもかかわらず、私たちはそれを“単純なデータ”だと思い込み、構造を捨ててきました。しかし、意思決定に必要なのは平均ではなく、全体の形です。どの項目が束で動き、どこで分岐し、どの段階で異常が完成するのか。そこまで見えて初めて、打ち手は戦略になるのです。 バイナリデータは単純なのではありません。単純に扱われすぎていただけです。
DSA+DAGは、その見落とされてきた“世界の形”を取り戻すための方法論です。