サイコロの和と多次元立方体の関係
複数個の一様分布の和は、厳密にはどのような分布に従うのか。
2個のサイコロを同時に振ったとき、最も出やすいのは合計が7のとき。
なぜなら、1+6, 2+5, 3+4, 4+3, 5+2, 6+1 と、6通りの出方があるからです。
それに比べて合計が2となるのは、1+1 の1通り。合計が12となるのは 6+6 の1通りしかありません。
グラフにすれば、このようなテント型になります。
同じようにして、3個のサイコロの和をグラフにまとめると、こんな形になります。
* 計算サイト・サイコロの和の確率
>> http://www.calc-site.com/probabilities/dice_total
さらにサイコロの数を10個、20個と増やしていくと、グラフは滑らかな釣り鐘型曲線へと近づきます。
この釣り鐘型のカーブが「正規分布」なのだ、という話は統計学の教科書に譲るとして、
ここで問題にしたいのは正規分布に至るまでの途中の段階です。
たとえば上のサイコロが3個 ~ 一様分布を3個足し合わせた結果は、厳密にはどのようなカーブなのでしょうか。
あるいは一様分布を7個足し合わせた結果は、正確にはどのような分布なのでしょうか。
先に結果を示します。
以下は、Mathematicaというソフトで一様分布を1~7個まで足し合わせた結果を描いたものです。
(※ただしグラフの高さは正規化されていません。)
一定の美しい規則に従って、釣り鐘型曲線が削り出される様子が見て取れたでしょうか。
N個の一様分布の和は、N本の(N-1)次曲線の組み合わせから成り立ちます。
たとえばN=3(サイコロ3個)の場合、次の3本の2次曲線で、3つの区間をカバーしています。
y = x^2 -- {x = 0~√3/3 の区間}
y = x^2 - 3 ( (x-1(1/√3))^2 ) -- {x = √3/3~2√3/3 の区間}
y = x^2 - 3 ( (x-1(1/√3))^2 ) + 3 ( (x-2(1/√3))^2 ) -- {x = 2√3/3~√3 の区間}
では、どうやってこれらの曲線を求めたのか。
実はこれらの曲線は、N次元の立方体を、対角線に直行して切った切断面の面積のグラフなのです。
まず2個のサイコロで考えてみましょう。
1個目のサイコロの目を横軸に、2個目のサイコロを縦軸に、全ての出目を図示すると6×6の正方形となります。
この正方形の上で、2つの目の合計が一定となる線は、右下がり45度の直線となります。
たとえば、上の図で青で引いた線は合計が4となる直線。
赤で引いた線は合計が7となる直線です。
そして、これらの合計が一定となる直線の長さは、その合計値が出る場合の数=確率に比例しています。
そこで、改めて正方形の黄色い対角線を横軸にして見れば(つまり図を45度傾けて見れば)、
正方形がそのままテント型の分布を形作っていることに気付きます。
次に次元を1つ上げて、3個のサイコロの和を考えてみましょう。
3個のサイコロを3次元の縦、横、高さに配置すれば、6×6×6の立方体となります。
この立方体の上で、3つの目の合計が一定となる面は、立方体の対角線に直行する面となります。
立方体の対角線を軸にして、切断面の面積をグラフに描けば、3個のサイコロ(一様分布)の和の分布となります。
立方体の切断面は、図の手前から順に3つのパートに分かれます。
1番手前の青色のパートは、1つの頂点からスタートし、三角錐がどんどん大きくなる過程。
2番目の中間にある黄色のパートは、断面の正三角形から、もう一方の反対向きの正三角形に向けて、6角形の断面が徐々に変形する過程。
3番目の赤色のパートは、1番目と反対に三角錐がどんどん小さくなる過程です。
1番目と3番目のパートが2次曲線となることは、断面積が辺の長さの2乗となることから想像が付くでしょう。
ちょっと悩むのは2番目の、中間にある6角形断面のパートです。
この2枚のスケッチは、6角形断面のパートを取り出して描いたものです。
特に2枚目のスケッチをよく見てください。
断面の6角形とは、拡大する1つの正三角形の3つの頂点から、3つの正三角形を差し引いた残りだと見なせます。
拡大する1つの正三角形と、差し引く3つの正三角形は、実は全く同じ図形を空間的にずらしたものです。
というのも、差し引く3つの正三角形は、元の立方体の隣に位置する、同じ形の立方体の断面だからです。
空間を埋め尽くしている立方体の群れを切断することを想像すれば、
とある1つの立方体の断面積は、同じ形の正三角形を足したり引いたりすることで算出できるのです。
より具体的に、6角形断面の中間パートは次のように定式化できます。
(1番目のパートの正三角形) - 3×(途中から始まった2番目のパートの正三角形)
立方体の対角線の長さは √3 です。
そして、対角線に対する3つのパートの幅はそれぞれ等しく √3/3 ずつです。
なので (途中から始まった…)とは、数字の上では √3/3 だけずらすことを意味します。
以上に基づいて式を完成させたものが、当初に挙げた「一様分布3個」のグラフだったのです。
※3個のサイコロについては、以下がわかりやすいです。
※『ちょっとした「つり鐘型曲線」を描いてみる』
※ https://teenaka.at.webry.info/201704/article_12.html
※『ちょっとした「つり鐘型曲線」と正規分布の関係』
※ https://teenaka.at.webry.info/201704/article_13.html
4個のサイコロ(一様分布)の足し合わせは、4次元立方体を対角線に直行するように切断した断面として表わされます。
4次元立方体を直接描くことはできませんが、断面である3次元図形を想像することは可能です。
4次元立方体の断面は、以下の4つのパートから成り立ちます。
第1パート:正4面体がだんだん大きくなる過程。
第2パート:正4面体の各頂点が削れ、正8面体となる過程。
第3パート:正8面体の4つの面が成長して、正4面体となる過程。
第4パート:正4面体がだんだん小さくなる過程。
これらの過程は、3次元の場合と同じように、最初の正4面体の足し引きによって定式化できます。
第1パート:(正4面体)
第2パート:(正4面体) - 4×(1つずらした正4面体)
第3パート:(正4面体) - 4×(1つずらした正4面体) + 6×(2つずらした正4面体)
第3パート:(正4面体) - 4×(1つずらした正4面体) + 6×(2つずらした正4面体) - 4×(3つずらした正4面体)
式中に登場する正四面体の数、4、6、4 は、二項係数となっています。
二項係数とは、n個の中からk個の要素を取り出す組み合わせの数のことです。
なぜ二項係数となるのか。
4次元立方体の各頂点に、4桁の0または1で番号を付けることを考えます。
4つの頂点は4つの次元に対して、それぞれ手前と奥のどちらか(あるいは上下、右左などの)一方に位置付けられます。
最も手前にある頂点 0000 から出発して、1111に向かって辺で結ばれた頂点を線で結んでたどってゆくと、以下のような図形が描かれます。
(このような図を“ハッセ図”と言います。)
この図から、同一切断面に並ぶ頂点の数は「4つの桁の中に何個かの1が入る組み合わせの数」になっていることが分かります。
そしてこの頂点の数は、そのまま足し引きすべき図形(正四面体)の数となっているわけです。
以上で見てきた関係は、そのまま次元数が上がっても変わりません。
・最初のパートはN次元の角錐から始まる。グラフの上で、最初の区画は(N-1)次の曲線となる。
・最初のパートの図形(N次元の角錐)を、二項係数に従って足し引することによって、2番目以降のパートをつなげる。
(足し引きは、プラスマイナスを交互に繰り返せばよい。)
こうして、N次元立方体の断面から、N個の一様分布の和が描き出されます。
※ 最初のパートとなるN次元の角錐の体積は、前の記事に記載しました >> d:id:rikunora:20190210
サイコロの数をうんと増やした極限が正規分布になる、ということは、正規分布とは“無限次元立方体の切断面”の形だということになります。
単なるサイコロの足し合わせを、多次元立方体の切断面として捉えるならば、また違った風景が見えてくる。