二項分布からランダムウォークの正規分布を導出

ランダムウォークの正規分布を導出する方法は、検索するといろいろ出てきますがその中で次のの2つで勉強させていただきました。

http://sys.ci.ritsumei.ac.jp/probability/2008/0618-25.pdf

http://www.eco.kindai.ac.jp/hoshikawa/others/NormalD.pdf

ただ式変形の過程がいまいち追いきれなかったり、難しいと感じた部分に注釈をつけながら自分なりにまとめた文書です。

二項分布

確率pで当りが出るくじ引きがある。n回試行しk回あたりが出る確率分布は次の式で表され、二項分布と呼ばれている。

この式の nCk は次の二項定理の式のことである。

確率p=½の場合を考えるので

確率変数 k は n 回試行して k 回あたりが出る数であるが、ここではランダムウォークで位置 m にいる確率を求めたい。そこで、k を m  に変換しておく。m は k 回右に動いて、n-k回左に動いた結果の位置なので次のように k を m であらわす。

この k を P(k,n) に代入すると、次式を得る。

スターリングの公式で階乗を排除

階乗部分をシンプルにしたいのでスターリングの公式を導入

スターリングの公式

P(m,n) の対数をとる

スターリングの公式を階乗部分に適用すると、上記の4項は次の4行であらわされる(それぞれの項が行に対応している)。

これをさらにまとめると

2行目は 0、3行目は-½ ln2πなので

ln(1+x)を展開

の部分をマクローリン展開で簡単にあらわすために  の形にする

 と変形すると

P(m,n) に適用すると

ただし、,とおいた(見た目シンプルにするだけのため。)

さらに、対数の種類ごとにまとめると

n+½-A-B=-½, A+B-n=1 なので

 をO(3)以降を切り捨ててマクローリン展開する。

なお、ln(1+x)の展開は次式である。

これを利用して

 = 

となる。

m<<n のとき、(m/n)^2も無視できるので切り捨てる。

対数を元に戻すと次のような正規分布っぽい形になる。

確率変数とステップ幅の変換

mは回数なので、移動距離に変換したい。mが1増えるごとに、距離a移動することにすると、原点からの距離 x は

このままではステップの回数が偶数か、奇数かによって到達できないノードが存在するそうな。このためxの増分を mが二回増えるのに相当する距離に設定しておく。

 

よって n回試行して原点からの距離 x に移動する確率密度関数 P(x,n) は次式であらわされる。

特徴

次式の平均μ、分散σ^2 の正規分布と照らし合わせると

となっているので、分散が試行回数に比例している。分布の幅が√n で広がっていくことがわかる。

また、P(0,n)はn回施行後に原点にいる確率であり、式から1/√n に比例して減少していくといえる。