データ分析の世界では、平均や相関、回帰といった統計手法が広く使われています。
これらは非常に強力な方法ですが、ある特徴があります。
それは、単一の指標で現象を説明しようとすることです。
例えば、臨床研究では平均値の差によって治療効果を判断します。
平均で有意差があれば「効果あり」、なければ「効果なし」と判断されます。
この考え方は、どこか西洋医学的です。
西洋医学では、例えば
- 熱がある → 解熱剤
- 血圧が高い → 降圧剤
というように、症状と対処を比較的直接的に結び付けます。
しかし東洋医学では、同じ「熱」という症状でもすぐに解熱するわけではありません。
まず患者の全体状態を見ます。
- 気虚
- 血虚
- 陰虚
- 実熱
- 虚熱
つまり、症状の背後にある「証(状態の構造)」を診るのです。
実はリアルワールドデータでも、似たことが起きています。
平均値では差がないのに、分布をよく見ると
- 一部では大きく改善
- 一部では悪化
- 多くは変化なし
というように、異質な集団が重なっていることがあります。
平均だけを見ると「効果なし」となりますが、分布構造を見ると
「特定の条件の患者群では効果がある」と分かることもあります。
DSA(Distribution Structure Analysis)は、まさにこの
分布構造に着目する分析です。
平均値を代表値として扱うのではなく、
データの内部に存在する異質性や構造の違いを可視化します。
さらにDAG(因果グラフ)と組み合わせることで、
その構造の背後にある因果関係の候補を探索することができます。
言い換えると、
従来統計が「平均」を見るのに対して、
DSA+DAGは「状態の構造」を見る方法と言えます。
もしこの比喩を使うなら、
従来統計は
西洋医学型の分析
DSA+DAGは
東洋医学型の分析
に近いのかもしれません。
AIが統計分析を自動化する時代になりました。
しかしAIが出す多くの分析結果は、依然として
- 平均
- 相関
- 回帰
といった「平均世界」の分析です。
リアルワールドの複雑さを理解するには、
平均ではなく構造を見る視点が必要になるのではないでしょうか。
