概率统计 二项分布 中心极限定理

(1) 何らかの方法で から までの数 (digit) の一様乱数 個の表を作るとき、数 以下しか現れない確率 を式で描け。ここに 個の乱数で が出現する回数、 は事象 の確率を表す。
なお、次のような記法を使ってもよい。

(2) 一般に、 を互いに独立で同じ分布をもつ確率変数の列とし、それらの平均値と分散をそれぞれ とする。また、それらの和を で表す。このとき、任意に固定した実数値 に対して


となることが知られている。これは中心極限定理の特別な場合である。このことを利用して、上述の確率 が近似的に算出できることを説明し、おおよその値を求めよ。ただし、(表1)を利用してもよい。

表:

0.00.10.20.30.40.50.60.7
0.5000.5390.5790.6170.6550.6910.7250.758
0.80.91.01.11.21.31.41.5
0.7880.8150.8410.8640.8840.9030.9190.933
1.61.71.81.92.0
0.9450.9550.9640.9710.977

解答:

(1)
乱数1つにつき数 が現れる確率は である。
個の乱数から数 が現れる回数 は二項分布 に従う。
したがって、求める確率は以下のように表される。

(2)
番目の乱数が であるとき 、そうでないとき とする。
は互いに独立に同じベルヌーイ分布に従い、その平均 と分散 は次のようになる。

のとき、和 について、平均と標準偏差はそれぞれ次のように計算される。

中心極限定理を利用して を標準化すると、 は標準正規分布 に漸近的に従う。

であるため、定理の式を用いて確率を近似すると、

標準正規分布の対称性より であるから、

表より である。線形補間により の値を近似する。

したがって、求めるおおよその値は以下のように計算される。


补充说明:
本题考察了概率论中的二项分布以及利用中心极限定理对二项分布进行正态近似求解。第一问中,由于每次产生随机数是独立重复试验,且目标数字7出现的概率固定,因此出现次数服从二项分布,直接写出累加形式的精确概率表达式即可。第二问要求利用棣莫弗-拉普拉斯中心极限定理进行近似计算。解题的关键是将总次数分解为一万个独立的伯努利随机变量之和,求出单次试验的期望与方差,进而得到整体和的期望与标准差。进行标准化处理后,将问题转化为求标准正态分布在负区间上的累积概率。利用标准正态分布的对称性质,将其转化为已知正区间的概率计算。由于算出的阈值约为1.133,在给定的正态分布表中介于1.1和1.2之间,为了获得更准确的答案,这里采用了线性插值法进行估算。如果在实际考试中直接取用最接近的1.1的值进行简单估算得到约0.136,根据判卷标准通常也是可以接受的近似做法。