小沢検察審議会の平均年齢

検察審議会が統計に格好のネタを提供してくれたようです。
すでにあちこちで取り上げられている話題なので今更なのですが、ここでも検証を行ってみました。

* 実態がナゾだらけ「検察審査会」メンバーはホントに存在するのか?
>> http://wpb.shueisha.co.jp/2010/11/01/919/
* 「小沢起訴」審査員平均30.9歳は「100万分の7」の確率
>> http://www.news-postseven.com/archives/20101011_3079.html

小沢一郎民主党元代表に対し、「起訴相当」と議決した検察審査会の審査員は11人いるが、その平均年齢は30.9歳だったとされる。有権者から「くじ」で選ばれることになっているが、有権者の平均年齢は約52歳。この大きな差から、「本当にくじで選ばれているのか」という疑問が湧いている。 (その後、平均年齢には訂正が為されている)


小沢氏を起訴へと追い込んだ東京第5検察審査会について、審査員の平均年齢が不自然に低いのではないかとの疑惑です。
検察審議会の審査員は「各検察審査会管轄地域の衆議院議員の選挙権を有する国民の中から、くじで無作為に選ばれた11名で構成される」とのことです。>> Wikipedia:検察審査会
東京審議会であれば、東京都民から無作為に11人を選んだとき、平均年齢はいったい何歳くらいになるのが自然なのでしょうか。

まずは単純に、20歳〜70歳の年齢の人口が全て同じだったとして確かめてみましょう。
20歳からとしたのは、衆議院議員の選挙権を有する国民というところからです。
70歳までとしたのは、70歳以上であれば「職務を辞することができる」からです。
本当は70歳以上である可能性もあるのですから、この切り方だと平均年齢は実際よりも低めに出るわけです。
Excelを使って、20〜70の範囲の乱数を11個ずつ、大量に生成してみました。

こんな感じに、乱数を11人x1000件作成して、
その平均年齢をヒストグラムにまとめた結果が、これです。

赤色のところが年齢34歳以下の部分。
私が試したときには、33歳が1件、34歳が2件でした。
確率で言えば (1+2)/1000 = 0.3% ということになります。

しかし、実際には若い人ほど人口が多くて、高齢者ほど人口が少なくなっているかもしれません。
そこで、東京都の住民基本台帳データをもとにして、各年齢の人口比率に比例するように審査員を選んでみました。
* 住民基本台帳による世帯と人口 平成22年1月
>> http://www.toukei.metro.tokyo.jp/juukiy/2010/jy10q10601.htm
住民基本台帳の20〜69歳の分布は、このようになっていました。

その中から、11人x1000件のサンプルをランダムに抜き出した分布は、こうなりました。

だいたい上と同じ形をしています。
このサンプルを元にヒストグラムを作ったところ、こんな結果になりました。

赤色が年齢34歳以下の部分。
32歳が1件、33歳が2件、34歳が8件でした。
確率は (1+2+8)/1000 = 1.1% 。
せっかくなので、もう1回同じことを行ってみました。

結果、30歳が1件、33歳が1件、34歳が6件でした。
確率は (1+1+6)/1000 = 0.8% です。

上のヒストグラムから、たくさんのシミュレーションを行った結果はなんとなく釣鐘型になる、ということが見てとれると思います。
実は、元になる人口の分布がどんな形であっても、そこからたくさんのサンプルを抜き出して作った平均の分布は、釣鐘型の正規分布になるということが知られています。(中心極限定理
今回のサンプル数は11人ですが、それでもかなり釣鐘型っぽいでしょ。
そこで、結果が正規分布になるのだと考えて、年齢が34歳以下になる確率を計算から求めました。
計算方法は、およそ次の通りです。

住民基本台帳から、対象となる東京都民の平均年齢を求める => 43.660 歳となった。
住民基本台帳から、対象となる東京都民の分散を求める => 192.925 となった。
・標本平均の標準偏差 = √{(東京都民の分散)/(11人)} = 4.188
・以上の数字と、正規分布の表から確率を知ることができる。
 Excelの場合「=NORMDIST(34, 43.660, 4.188, TRUE)」と入力すると、34歳以下の確率がわかる。
 その結果は、0.0105、つまり 1.05% だった。
・同様の計算から、34.27歳以下の確率は 1.25%、30.9歳以下の確率は 0.12% となった。

いずれにせよ、こんなことが立て続けに2回も起こったのであれば、
「審査員は無作為に選ばれたとは言えない」と考えるのが自然です。

今回の記事は、ブログ友達である271828さんから教えてもらったものです >> 271828の滑り台Log
以下の切り抜きを送っていただきました。

週刊朝日』-- 10/22より. 桜美林大学教授、数学者 芳沢光雄
・・・まずは住民基本台帳から東京都の20歳から69歳の人(今年元日)を計算しました。
その合計は881万6990人。平均年齢は、43.659歳だった。
そこから数学的な定理(中心極限定理)を応用し計算すると、小沢氏の審査会1回目で出た平均年齢「34.27歳」以下になる確率は「1.28%」。
2回目の「30.90歳」以下になる確率は「0.12%」しかないんです。

あと、以下にある「とある理系の独り言」さんが精度の高い結果を引き出されています。
* 第五検察審査会の度重なる年齢変更について思ったこと
>> http://www.asyura2.com/10/senkyo97/msg/542.html

悩めるみんなの統計学入門 - 統計学で必ず押さえたい6つのキーワード

悩めるみんなの統計学入門 - 統計学で必ず押さえたい6つのキーワード