対数正規分布の仕組み

年収(所得)の分布は、対数正規分布という形に従うと言われています。
* 貯金と年収の形 >> d:id:rikunora:20090622

出典: 厚生労働省 -- 所得の分布状況
>>http://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa08/2-2.html
対数正規分布とは、その名の通り正規分布に対数を付けたものです。
(確率変数の対数値が正規分布をするような統計分布を対数正規分布という。)
対数正規分布の形は、上の所得の分布のように左右非対称で、
左側(高所得側)に長い裾野が広がっています。
なぜこのような形になっているのか。いくつかの説明の仕方があると思うのですが、
今回は1つの単純なモデルで確認してみました。

・最初に1000人の新入社員がいたとします。
 入社直後、全員の給料には少しだけばらつきがありますが、ほぼ同額です。
・社員は一定期間ごとに、一定の確率で昇給するものとします。
 昇給する社員は1000人の中から乱数で全くでたらめに選び出します。
 つまり、ある特定の期間に、昇給する社員と昇給しない社員がいます。
・昇給は、1回につき5%ずつアップします。

以上をシミュレーションしてみると、こんな風になりました。
* 対数正規分布シミュレーション (要Flash10 Player)
>> http://brownian.motion.ne.jp/memo/LogNormall.html

最初のうちは、みんなわりと横並びです。

時間が経つにつれ、だんだんばらけてきました。この形状が、対数正規分布になっています。

さらに時間が経過すると、もっと大きく差が広がってきます。
入社当初からあまり変わらない人が居る一方で、少数がパラパラと抜きんでて高収入になっています。
・・・なんだか人生を見ているような気分になってきました。
このままシミュレーションを続けると、いずれ全員が画面からはみ出します。
シミュレーションには上限も退社もなく、いつまでも昇給し続けるからです。
現実には昇給し続けるということは無いでしょうから、
シミュレーションを途中で止めたような形になるわけです。
実際の会社には、個人の能力とか、会社組織とか、いろいろと複雑な事情があるはずです。
それでも全体の分布形状が単純な乱数シミュレーションに近いということは、
個々の複雑な事情は、全体から見れば相殺されて消えてしまうということなのでしょうか。
そう思うと、たまたま収入が高かった、低かったというのも、
全体から見れば所詮は一定の確率で、つまり運で決まるのだという気もします。

以上の仕組みで、なぜ「対数」となるのか。
その秘密は、昇給が「1回につき5%」という比率で伸びてゆくところにあります。
比率で伸びてゆくということは、上に行けば行くほど、金額の上げ幅が大きくなります。
なので、左側の裾野が長くなるわけです。
比率とは掛け算で伸びるということですから、対数をとれば正規分布になるわけです。
もしこれが「1回につき5%」ではなくて、「1回につき1000円ずつ」であったなら、
そのまま正規分布になることでしょう。

このシミュレーションの考え方は、以下を元にしました。
* 格差分布の統計的ダイナミクス(PDF) >> http://www.iips.org/bp/bp332j.pdf
* Random Multiplicative Processes: An Elementary Tutorial (1990)
 >> http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.3.645