2013年9月17日火曜日

お久しぶりの情報の誤伝達

そんな大層なものではないジャンルのやつです。

N列の数字列(初期はすべて0)を用意して、どんどん伝播させていきます。
伝播させるごとにそれぞれの数値にゆらぎが生じて・・・
等確率で+1,0,-1の変化をします。

さて、n回伝播したとき、どれくらいデータはぐちゃぐちゃになっているでしょーか?
つまり、そのデータの分散値(Σx^2)はどんくらいでしょーか?

まあ、基本的にはランダムウォークなので、もにょもにょと計算すれば一発です。

データ列が∞、すなわちN→∞ のときは、そのデータ内でランダムウォークすべての状態が網羅されていると考えてよいので、
分散: σ^2 = 2/3 n となります。

問題はNが有限のときです。このときは、標本分散、s^2がサンプリングごとにゆらぐ、つまるところ確率変数とみなしてよいことになるので、
s^2をたくさんサンプリングしてその平均をとれば、中心極限定理より"真な"s^2(μ(s^2))が求まる気がします。
というわけで、ざくざくと最近勉強中のHaskellでデータを集めて計算してみると、

μ(s^2) = 2/3 *(1-1/N) * n

となりますた。当たり前ですけど、データ列が小さいほうが情報の崩壊が少ないっつーわけですね。

0 件のコメント:

コメントを投稿