なぜ統計学では釣り鐘型の分布が使われ、物理現象では右肩下がりの分布が使われるのか

「なぜ統計学では釣り鐘型の分布が使われ、物理現象では右肩下がりの分布が使われるのでしょうか」
という疑問を、統計学や物理学の有識者に会うたびごとに質問するが、こんな基本的なことに誰も答えられない
    -- データの見えざる手 [矢野和夫](思想社) P.32 より.

釣り鐘型の分布とは、正規分布ガウス分布)のこと。
右肩下がりの分布とは、指数分布(ボルツマン分布、上の書籍内では「U分布」)のことです。

ここに2つのグラフがあります。

1つは全国17歳学童の身長の分布、もう1つは二人以上の世帯の貯蓄額の分布です。
見ての通り、身長は釣り鐘型の正規分布で、貯蓄額は右肩下がりの指数分布です(近似的には)。
* 学校保健統計調査 平成27年度 全国表 > 身長の年齢別分布
>> http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001070659&cycode=0
* 家計調査報告(貯蓄・負債編)−平成27年(2015年)平均結果速報−(二人以上の世帯)
>> http://www.stat.go.jp/data/sav/sokuhou/nen/index.htm

見ての通り、2つのグラフは全く様相が違います。
人々の分布は、身長で見れば平均を中心にまとまっていますが、
富の分配で見れば極端な偏在 〜 一部の突出した持つ者と、大多数の少ししか持たない者に分かれます。
 『人は生まれながらに平等なのに、なぜ世の中は圧倒的に不平等なのか。』
この問を統計の言葉に置き換えれば、こうなります。
 『人の特質は正規分布に従うのに、なぜ社会的資源の分配は指数分布に従うのか。』
試しに「世界の富」でググってみてください、衝撃的なタイトルが次々とヒットすることでしょう。

世の中が正規分布に従っているものと思っていませんか。
確かに、学校の成績は正規分布に近い形です。
目に見える身長、体重、あるいはかけっこの速さといった個人差も、大抵は正規分布に類する釣り鐘型です。
しかし社会の階層は、どちらかと言えば指数分布に近い、右肩下がりの一強多弱形。
この違いに愕然とし、大人が悪い、上司が悪い、為政者が悪い、とクダを巻く人のいかに多いことか。
もちろん大人も上司も為政者もパーフェクトではありませんが、それらは第一要因ではありません。
前提にあるのは、正規分布も指数分布も、多数が集まれば自然にその形に落ち着くという統計的な事実なのです。

ではなぜ、分布は自然にできるのか。
それは、数が増えれば最も確率の高い状態が実現するからです。


■ 富の分布は右肩下がり

個性を持たない多数の分子に、総量一定のエネルギーを配るとき、最も確率が高くなるのはどのように配分したときか?
M円のお金をN人に分ける場合の数をひたすら数え挙げたとき、最も場合の数が多くなるのは、どんなときか?

答は、いずれも指数分布(ボルツマン分布)となります。
論より証拠、サイコロを使ってチップのランダムな交換をひたすら繰り返せば、右肩下がりの分布が自然にできあがります。
以下、文献から引用しましょう。
* 富の分布について(駒澤大学学術機関リポジトリより)
>> http://repo.komazawa-u.ac.jp/opac/repository/all/33054/

理経済学における「富の分布理論」
近年、一連の物理経済学者が、統計力学における気体の運動理論との類推で富あるいは所得の分布を説明しようとする試みを行っている。
彼らの考えでは、富はエネルギーに相当するものであり、ランダムに選ばれた経済主体間の富の交換は、
ランダムな対の気体分子によるエネルギーの交換と同様に取り扱うことが出来る、というものである。
また、富の平均が気体の温度に対応し、交換される富の総量は常に一定であり、これは、エネルギー保存の法則と対応する、としている。

Random sharing model
偶然に出会った、二人の経済主体の間で二人の富の総額をランダムに分割する、という交換ルールを何回も繰り返すモデルである。
  ・・・
このモデルは、偶然に出会った2人が自分たちの所有する富の総和を、ギャンブルで分け合うモデルと言う様にも解釈できよう。
  ・・・
このルールに基づいて富の交換を、分布の形が変化しなくなるまで繰り返すと富の分布は指数分布になることが知られている。

上の通りにシミュレーションを行った結果は、こうなりました。

不平等の度合いを表すジニ係数は0.50。
日本の平成26年当初所得ジニ係数 0.5704」でしたから、再分配前の格差は、このシミュレーションより少し大きい程度です。
* 参考: 厚生労働省平成26年 所得再分配調査報告書
>> http://www.mhlw.go.jp/file/04-Houdouhappyou-12605000-Seisakutoukatsukan-Seisakuhyoukakanshitsu/h26hou.pdf

指数分布は最も簡明なモデルですが、必ずしも経済の全てが指数分布となるわけではありません。
シミュレーション条件を変えると、結果もまた変わってきます。

Hayes - Chakaraborti model
このモデルは、・・・極めてドラステックな結論が得られることで知られている。
今、N 人の経済主体がいるとする。
その中から、ランダムに一組のペアが選ばれ、そのペアの間で富の交換がなされる。
富の交換のルールはきわめて単純で次のようである。
(i) ペアのうち、貧しいほうの経済主体の富の大きさを越えない範囲で、ランダムな値が選ばれる。
(ii) そのようにして決められた値を、そのペアのどちらかが貰う訳であるが、どちらが貰うかもまたランダムに決める。
  ・・・
これは、あたかも、偶然に出会った二人が、所持金の小さいほうの額を上限とした掛け金でギャンブルをしてどちらかが得をし、
どちらかが損をするという過程を繰り返すというようなものである。

モデルのいったいどこが違うのか、注意深く読まないと分からないほど似ていますが、結果は大きく変わってきます。

今度の方が“ドラスティックに”格差が生じます。
ジニ係数は約0.77となりました。引用元論説によると、
「全く平等な状態(ジニ係数がゼロ)からはじめて、極めて不平等な状態(ジニ係数が 1 )に推移することが分かる。」
なぜここまで格差が開くのか。
今度のモデルの場合、一度持ち金がゼロになると、もはや全く交換が成されません。
ゼロでなくとも持ち金が極めて少なくなると、交換する金額自体も小さくなるので、貧困からの脱出がより困難です。
「世界人口の半分と同じ富が62人の富豪に集中」といった世界の富の分配は、こちらのモデルにより近いように思えます。


■ 偶然の和は釣り鐘型

一方、身長や学力などに現れる正規分布は、どのようにしてできるのでしょうか。
速い話、乱数をたくさん足し合わせれば正規分布となります。
これも論より証拠、サイコロの足し合わせを何度も繰り返してみてください。

グラフは、エクセルで乱数 RAND()を12個足し合わせたものを、1000回繰り返した結果です。
サイコロやエクセル乱数は、でたらめな数が均等に出てくる一様分布ですが、
たとえ均等でない乱数であっても足し合わせた結果は正規分布となります。
(ただし、平均や分散を持たないような特殊な乱数は除きます。)
この事実は「中心極限定理」と呼ばれており、正規分布が「正規」であることの理由となっています。
身長を例にとるなら、そこには持って生まれた資質、日々の食事の内容、生活習慣、等々、
無数の要因が合わさって結果を形作っていることでしょう。
1つ1つの要因が乱数にも似た偶然であるなら、偶然の足し合わせである正規分布が、
世の中の至る所に顔を出すのは頷ける話でしょう。


■ 分布の違いは距離感の違い

ここに来て、ようやく当初の疑問の意図が明らかになったのではないでしょうか。
正規分布も指数分布も、どちらも“自然の摂理に適った”分布なのです。
しかしなぜ、“自然な分布”には2種類あるのか。
なぜ、身長や学力は正規分布で、エネルギーやお金は指数分布なのか。
人間には多少の個性(ばらつき)はあれど、平均に回帰するが本来の姿である、とするのが前者の主張。
そもそも世の中は不平等にできていて、小数の強者と多数の弱者となるのが当然の姿である、とするのが後者の主張。
どちらにも拠るべき根拠があり、どちらも正しいのです。
ここで「対象が違えば分布が違って当然」と思うなら、
いかなる性質を持つ対象が釣り鐘型となり、
どんな性質であれば右肩下がりになるのでしょうか。
その性質をお金に持たせることによって、富の分配を釣り鐘型にすることはできないのでしょうか。

2つの分布の成り立ちを、もう少し深く探ってみましょう。
一般に指数的な減衰は、次の微分方程式に従います。
  f'(x) = - λ f(x)   ・・・☆指数分布の微分方程式
ある地点における減り方は、その地点での値そのものに比例する、と読めます。
1つ上のレベルにステップアップする人数は、そのレベルに居る人数に比例する。
つまり一定の割合でレベルアップする(あるいは脱落する)ということです。
  f(x) = C exp( - λ x )

一方、正規分布は次の微分方程式に従います。
  f'(x) = - λ x f(x)   ・・・★正規分布微分方程式
ある地点における減り方は、その地点での値と原点からの距離に比例する、と読めます。
上の ☆ と比べると、右辺に x が1つ入っているところが違います。
「原点からの距離」というファクターが入ったおかげで、
プラス側もマイナス側も同じように、原点から離れるほど減るようになっています。
  f(x) = C exp( - (λ/2) x^2 )
どうやら秘密はこの「距離」というところにありそうです。

☆指数分布 -> ★正規分布ときた流れを、そのまま延長していったらどうなるでしょうか。
以下のような一連の微分方程式を考えてみましょう。
  f'(x) = - λ x^2 f(x)
  f'(x) = - λ x^3 f(x)
  f'(x) = - λ x^4 f(x)
    ・・・
これらのグラフを順番に描くと、こんな風になります。

指数分布と正規分布はいかにも“自然な”感じがしますが、
それより高次の分布があったとしても不思議では無い、
少なくとも数学的にはあっても構わないという気がします。
あるいは、これらの分布の間を連続的に埋める分布があっても良いようにも思えます。

ここで改めて「距離」について考えてみましょう。
普通、距離といえばユークリッド距離 d = √(x^2+y^2) のことを指しますが、
もっと柔軟に考えれば、とにかく2点間の隔たりを示す値であれば何でも、ある種の距離であると見なせます。
数学的には、
 ・非負性: d(a,b) >= 0
 ・非退化性: a=b <=> d(a,b)=0
 ・対称性: d(b,a) = d(a,b)
 ・三角不等式 : d(a,b) + d(b,c) >= d(a,c)
を満たす関数 d(a,b) は、全て距離の仲間です。>> wikipedia:距離空間
下に描かれてている図形は全て、ある種の距離で測った「円」なのです。

まあ、よほどのひねくれ者でない限り、普通は“均等に丸い”円を選ぶと思うのですが、
たとえ他の曲線を選んだとしても、距離的にはOK(?)なのです。
この距離の図と、先の一連の分布のグラフを重ねて見れば、両者の対応は一目瞭然でしょう。
距離の図で、“均等に丸い”円に相当するのが正規分布で、
ひし形の絶対値距離に相当するのが指数分布です。

・対象となる要素間の距離がユークリッド的に測れる場合 -> 正規分布
・対象となる要素間の距離が絶対値的に測れる場合 -> 指数分布
・対象となる要素間の距離がミンコフスキー的(?)に測れる場合 -> 高次の分布

これが、2つの分布に対する、私なりの解釈です。
正規分布の式に見られる2乗はどこから来るのか。
導出の過程を追ってみると、「距離を2乗で測る」ところに源流がありました。
* 正規分布の導出 >> d:id:rikunora:20170310
そう思えば、指数分布が1乗距離であることにも納得がいくと思うのですが、いかがでしょうか。


■ 富の距離感を変える

もし分布が距離の反映であるならば、距離感を変えることによって、分布が変わるかもしれません。
今日のお金は絶対値距離、単純に数値そのものが隔たりとなっていますが、
もしこれが変われば、分布も変わってくるでしょう。

富の分布が右肩下がりになる背景には、プラスとマイナスの非対称性があります。
プラスの側は際限なく大きくできるのに、マイナスの側には限りがある。
上記のモデルについて言えば、ゼロという下限が非対称性をもたらしています。
ならば、いっそ下限を取っ払ってプラスマイナス対称にしたら、どうなるか。

もしマイナス側にストッパーが無かったなら、現状よりもずっと格差が大きくなるように思えます。
「破産とは救済策である」と聞いたことがあります。
もし破産が無かったら、借金を返すために何処までも何処までも、子々孫々に渡るまで働き続けなければならない。
破産すればそこでリセットできるので、それ以上取り立てできない。
なので、破産は最後の救済策なのです。
その救済策を無くしたら、格差は上だけでなく、下側にも拡大することになるでしょう。
物理で言えば、拡散方程式。
しかしこれで、とにかく分布は釣り鐘型になります。
上下対称なのだから、自然とそうなります。

問題の本質は、拡大し続けることにあります。
ならば、拡大した分だけ、全体のスケールを縮めれば良いはずです。
プラス側の財産は、一定の割合で目減りする。
同様にマイナス側の借金も、一定の割合で消えてゆく。
つまり、功績も負債も、時が経つにつれて忘れられてゆく。

・下限の廃止 -- プラス側もマイナス側も対称にする。
・スケール縮小 -- 拡大の速度に合わせて、プラス側もマイナス側も同様に縮小する。

マイナス側も縮小するのだから、どんな借金も時が経てばいつかは消滅します。
それ以上の速度で借金できないように、システムに上限を定めれば良いのです。
同様に、どんな巨万の富も、時が経てば薄まり、消えてゆく運命にあります。
金額の絶対値ではなく、「速度」であるところがミソ。
プラス側で稼げる速度を見越して、ちょうどそれに釣り合う速度で借金を薄めれば、全体としての釣り合いがとれるはずです。

・プラスマイナスの拡大量を見て、その平均をゼロ点と定める。
・プラスマイナスの拡大速度に合わせて、スケール縮小の比率を定める。
・ゼロ点とスケール縮小比率は、その時々の経済活動に合わせて(公定歩合のように)随時調整する。

このシステムであれば、分布は間違いなく釣り鐘型に移行するでしょう。

新システム(?!)の視点から現行システムを見直すと、現行の特徴が浮き彫りにされます。

・プラス側の成長することばかりを夢見て、同じ量だけマイナス側が生じることに目をつぶってきた。
・「財産はプラスになるのが当たり前、マイナスになるのは本人が悪い」と信じられてきた。

成長・利子・借金。
この3つはセットになって、時が経てば経つほど指数的に拡大します。
対処療法にも限界があります。
プラスだけの幻想を捨てて、プラスマイナスゼロにする。
分布を変えるとは、きっとそういうことです。


■ 分布の上に行きたいか、形を変えたいか

指数分布、あるいは極端な右肩下がりの分布を突き付けられたとき、多くの人の反応は2つに分かれます。

 ・分布の中で上位を目指そうとする。
 ・分布の形を変えようとする。

実際にはほとんどの人が、前者の考えに傾きます。
後者に思い至る人は、ごく少数です。
より正確に言うと「分布の中で、下位に落ちないように備えを固めようとする」のが、
最大多数の取る態度であるように思われます。
人を動かすのは結局のところ不安と心配なのだと、思わずにはいられません。

私は折に触れ、この分布と偏在の話を人に訊ねてきました。
それらの個人的な感想なので、あるいは場所によって、問い方によって、結果は違ってくるのかもしれません。

それでも、両者のどちらが正義かと問えば、やはり後者に軍配が上がると思います。
前者は一握りしか幸せになれませんが、後者は大多数が幸せになれるからです。

It has been said that democracy is the worst form of government except all the others that have been tried.
「民主主義は最悪の政治形態である。ただし、これまで試みられてきた、それ以外の全ての政治形態を除けば。」
by ウィンストン・チャーチル


■ 参照リンク・過去の関連記事まとめ

統計分布の基礎 -- 貧乏/金持分布 >> d:id:rikunora:20080422
100人の村でランダムにお金を交換したら? >> http://brownian.motion.ne.jp/memo/Binbou.php
貯金と年収の形 >> d:id:rikunora:20090622

正規分布の導出 >> d:id:rikunora:20170310
対数正規分布の仕組み >> d:id:rikunora:20100418
指数分布の理由 >> http://brownian.motion.ne.jp/11_WhyPPMisImpossible/08_ReasonForExp.html
君はエントロピーって言葉を知ってるかい?(2) >>d:id:rikunora:20110518
べき分布のメカニズム >> d:id:rikunora:20091130

ニコニコ動画再生数は対数正規分布に従う >> d:id:rikunora:20140320
ニコニコ動画と日本の都市人口の意外な関係 >> d:id:rikunora:20140328
インターネットは一強多弱 >> d:id:rikunora:20140416

なぜ過密と過疎ができるのか >> d:id:rikunora:20141129
幸せは加速度センサで測れる >> d:id:rikunora:20141205

お金の要らない世の中、働かなくても良い世の中、勉強しなくて良い世の中 >> d:id:rikunora:20080420
科学の力で怠けよう! >> d:id:rikunora:20080421
幸福量保存の法則 >> d:id:rikunora:20080618

ミクの歌って覚える統計入門 >> http://miku.motion.ne.jp/