データ分析の世界では、平均や相関、回帰といった統計手法が広く使われています。
これらは非常に強力な方法ですが、ある特徴があります。

それは、単一の指標で現象を説明しようとすることです。

例えば、臨床研究では平均値の差によって治療効果を判断します。
平均で有意差があれば「効果あり」、なければ「効果なし」と判断されます。

この考え方は、どこか西洋医学的です。

西洋医学では、例えば

  • 熱がある → 解熱剤
  • 血圧が高い → 降圧剤

というように、症状と対処を比較的直接的に結び付けます。

しかし東洋医学では、同じ「熱」という症状でもすぐに解熱するわけではありません。
まず患者の全体状態を見ます。

  • 気虚
  • 血虚
  • 陰虚
  • 実熱
  • 虚熱

つまり、症状の背後にある「証(状態の構造)」を診るのです。

実はリアルワールドデータでも、似たことが起きています。

平均値では差がないのに、分布をよく見ると

  • 一部では大きく改善
  • 一部では悪化
  • 多くは変化なし

というように、異質な集団が重なっていることがあります。

平均だけを見ると「効果なし」となりますが、分布構造を見ると
「特定の条件の患者群では効果がある」と分かることもあります。

DSA(Distribution Structure Analysis)は、まさにこの
分布構造に着目する分析です。

平均値を代表値として扱うのではなく、
データの内部に存在する異質性や構造の違いを可視化します。

さらにDAG(因果グラフ)と組み合わせることで、
その構造の背後にある因果関係の候補を探索することができます。

言い換えると、

従来統計が「平均」を見るのに対して、
DSA+DAGは「状態の構造」を見る方法と言えます。

もしこの比喩を使うなら、

従来統計は
西洋医学型の分析

DSA+DAGは
東洋医学型の分析

に近いのかもしれません。

AIが統計分析を自動化する時代になりました。
しかしAIが出す多くの分析結果は、依然として

  • 平均
  • 相関
  • 回帰

といった「平均世界」の分析です。

リアルワールドの複雑さを理解するには、
平均ではなく構造を見る視点が必要になるのではないでしょうか。