2012年10月11日木曜日

情報の誤伝達4

結局確率過程はマルコフ過程の手前まで頑張りましたが、そこで停滞中です…。

そこで、今ある知識でちょっとでもがんばろうと思いまして、
まず情報列のうちのひとつだけに着目したいと思います。
情報各列は独立に伝達されると仮定するわけです。
もちろん『わたしは』とかの情報列は独立ではないので、仮定から外れます。

「n回伝達された際、そこの情報がxだけずれている確率(x ≧ 0 の整数)」
を考えたいと思います。
明らかに確率は原点で対称になるはずですからxは非負の整数にします。

x≧0ですから、-1より1の方がx回多く出たということです。
動く量が0である回数をn-k回数とする。
そうした場合、k回の中で、1が-1よりx回多く出ればよい。
-1の出る回数をmとおけば、1の出る回数はm+xであるから
m + m + x =  k
これを解いて、 m = (k-x)/2 となる。
まず、mは整数でないといけないので、k ≡ x (mod 2)が条件。

そうして、1の出る回数はm+x = (k+x)/2であるから、
xずれる確率は、











となります。あとはほろほろと計算をすればいい。
簡単のため、伝達回数n = 5とします。
そうすると、xは0~5になるので、頑張って計算できそう…。
無論プログラミング組めよ!と思いますが、この記事ではペンを動かします。

P(0)=51/243 ~ 0.21
P(1)=45/243 ~ 0.19
P(2)=30/243 ~ 0.12
P(3)=15/243 ~ 0.06
P(4)=5 /243 ~ 0.02
P(5)=1 /243 ~ 0.0004

となりました。あら?ちゃんと減ってる・・・
実際は対称性があるので、グラフとしてはこうなります。















あら?綺麗なもんですね…

この確率分布の「距離」の期待値を考えると、
E ~ 1.44 となりました。なるほど、必ず間違えてしまうのか。

実際、この前のプログラミングでやってみます。
10 1 5で出力してみると、


-1, 2,1, -2, 1, -2, 0, 0, 1, 0, とデータが得られたので、
平均してみるとちょうど1になりますね、まあたしかに1.44ってのは妥当か

問題は、この前定義した「誤り平均」です。
それぞれが1.44でズレるはずなので、誤り平均もこれに相当したものになるはず。
それぞれが独立に振舞うので当たり前ですが・・・

10 5 5で出力してみます。


2, 1, 0, -4, 0, 誤り距離平均: 1.40, 誤り分散: 4.58
-1, 1, 2, 0, 1, 誤り距離平均: 1.00, 誤り分散: 2.65
2, 1, -1, 2, 2, 誤り距離平均: 1.60, 誤り分散: 3.74
-1, -1, -1, -1, 1, 誤り距離平均: 1.00, 誤り分散: 2.24
-1, 3, 2, -1, 3, 誤り距離平均: 2.00, 誤り分散: 4.90
-1, -3, -1, -2, -3, 誤り距離平均: 2.00, 誤り分散: 4.90
0, 1, 1, 2, 2, 誤り距離平均: 1.20, 誤り分散: 3.16
3, 2, -2, 1, 0, 誤り距離平均: 1.60, 誤り分散: 4.24
2, 0, -2, 1, -1, 誤り距離平均: 1.20, 誤り分散: 3.16
0, -1, 0, 2, -2, 誤り距離平均: 1.00, 誤り分散: 3.00


ほうほう、ということは擬似乱数はおかしくなかったということか…!

次の記事で、プログラミングで伝達回数に対する誤り平均のデータを集めて、
グラフ化してみたいと思います。

とりあえずのまとめとしては、
「期待値としては絶対に情報は隣半くらいまでズレる」ということです。




0 件のコメント:

コメントを投稿