0185-2018 东新复数学 P96

概率统计概率论博弈论

プレイヤーはマシーンと一回のみゲームを行う． $i = 1, 2, \dots, n$ とし，プレイヤーが値 $i$ を出す確率を $p_{i}$ とし， $i = 1 \sum n p_{i} = 1$ とする． $j = 1, 2, \dots, n$ とし，マシーンが値 $j$ を出す確率を $q_{j}$ とし， $j = 1 \sum n q_{j} = 1$ とする．プレイヤーとマシーンは， $1$ から $n$ までの自然数を，この確率分布に従い出すものとする．プレイヤーとマシーンが同じ数を出したとき，プレイヤーの勝ちとする．このとき，以下の問に答えよ．

(問1) $i = 1, 2, \dots, n$ に対して， $p_{i} = 1/ n$ とする．プレイヤーが勝つ確率を求めよ．

(問2) $i = 1, 2, \dots, n$ に対して， $p_{i} = p_{1} α^{i - 1}$ とし， $j = 1, 2, \dots, n$ に対して， $q_{j} = q_{1} β^{j - 1}$ とする．プレイヤーが勝つ確率を， $α, β, n$ のみを用いて表せ．

(問3) $i = 1, 2, \dots, n$ に対して， $p_{i} = q_{i}$ とする．
(a) プレイヤーが勝つ確率の最小値を求めよ．
(b) マシーンが出す値の期待値が $(n + 1) /2$ であるとする．プレイヤーが勝つ確率の最小値を求めよ．

(問4) $(p_{1}, p_{2}, \dots, p_{n})$ をプレイヤーの戦略と呼ぶことにする．以下の二つの戦略を考える．

戦略E: $(p_{1}, p_{2}, \dots, p_{n - 1}, p_{n}) = (0, 0, \dots, 0, 1)$
戦略R: $(p_{1}, p_{2}, \dots, p_{n}) = (1/ n, 1/ n, \dots, 1/ n)$
ここで， $q_{1}, q_{2}, \dots, q_{n}$ のうち， $q_{n}$ が最大であるとする．
(a) 戦略Eは，戦略Rより優れていることを示せ．ここで，戦略A, Bに対して，戦略Aを用いたときのプレイヤーが勝つ確率が，戦略Bを用いた時のプレイヤーが勝つ確率以上のとき，戦略Aは戦略Bより優れているという．
(b) 戦略Eは，任意の戦略の中で最も優れていることを示せ．

解答：
プレイヤーとマシーンがそれぞれ値 $i$ と $j$ を出す事象は独立であるため，プレイヤーが勝つ確率 $P$ は，

P = k = 1 \sum n p_{k} q_{k}

で与えられる．

(問1)
$p_{i} = 1/ n$ より，

P = i = 1 \sum n \frac{1}{n} q_{i} = \frac{1}{n} i = 1 \sum n q_{i} = \frac{1}{n}

\frac{1}{n}

(問2)
$i = 1 \sum n p_{i} = 1, i = 1 \sum n q_{i} = 1$ より，
$α \neq = 1$ のとき $p_{1} = \frac{1 - α}{1 - α ^{n}}$ ， $α = 1$ のとき $p_{1} = \frac{1}{n}$ ．
$β \neq = 1$ のとき $q_{1} = \frac{1 - β}{1 - β ^{n}}$ ， $β = 1$ のとき $q_{1} = \frac{1}{n}$ ．
勝つ確率 $P$ は，

P = i = 1 \sum n p_{1} α^{i - 1} q_{1} β^{i - 1} = p_{1} q_{1} i = 1 \sum n (α β)^{i - 1}

これより公比の値によって以下に場合分けされる．

α \neq = 1, β \neq = 1, α β \neq = 1 のとき \frac{( 1 - α ) ( 1 - β ) ( 1 - ( α β ) ^{n} )}{( 1 - α ^{n} ) ( 1 - β ^{n} ) ( 1 - α β )} α \neq = 1, β \neq = 1, α β = 1 のとき \frac{n α ^{n - 1} ( 1 - α ) ^{2}}{( 1 - α ^{n} ) ^{2}} α = 1 または β = 1 のとき \frac{1}{n}

(問3)
(a)
$p_{i} = q_{i}$ より， $P = i = 1 \sum n p_{i}^{2}$ ．
コーシー・シュワルツの不等式により，

n i = 1 \sum n p_{i}^{2} = (i = 1 \sum n 1^{2}) (i = 1 \sum n p_{i}^{2}) \geq q (i = 1 \sum n p_{i})^{2} = 1

等号成立は $p_{1} = p_{2} = \dots = p_{n} = 1/ n$ のときであり， $\sum p_{i} = 1$ を満たす．

\frac{1}{n}

(b)
条件より $i = 1 \sum n i q_{i} = \frac{n + 1}{2}$ であり， $p_{i} = q_{i}$ より $i = 1 \sum n i p_{i} = \frac{n + 1}{2}$ が成り立つ．
(a)で求めた最小値を与える確率分布 $p_{i} = 1/ n (i = 1, \dots, n)$ において，

i = 1 \sum n i (\frac{1}{n}) = \frac{1}{n} \cdot \frac{n ( n + 1 )}{2} = \frac{n + 1}{2}

となり，この期待値の条件も満たす．よって最小値は変わらない．

\frac{1}{n}

(問4)
(a)
戦略Eを用いたときの勝つ確率は $P_{E} = i = 1 \sum n p_{i} q_{i} = q_{n}$ ．
戦略Rを用いたときの勝つ確率は $P_{R} = i = 1 \sum n \frac{1}{n} q_{i} = \frac{1}{n}$ ．
$q_{n}$ は $q_{1}, \dots, q_{n}$ の最大値であるから，

1 = i = 1 \sum n q_{i} \leq q i = 1 \sum n q_{n} = n q_{n}

よって $q_{n} \geq 1/ n$ となり， $P_{E} \geq P_{R}$ が成り立つ．したがって戦略Eは戦略Rより優れている．(証明終)

(b)
任意の戦略 $(p_{1}, \dots, p_{n})$ における勝つ確率を $P$ とすると， $p_{i} \geq 0$ と $q_{i} \leq q_{n}$ より，

P = i = 1 \sum n p_{i} q_{i} \leq q i = 1 \sum n p_{i} q_{n} = q_{n} i = 1 \sum n p_{i} = q_{n} = P_{E}

よって任意の戦略について $P_{E} \geq P$ が成り立つため，戦略Eは任意の戦略の中で最も優れている．(証明終)

本题考察了离散概率分布的基本性质以及博弈论中策略选择的简单应用。胜率的计算本质上是两个概率向量的内积。第二问考察等比数列求和，难点在于准确地根据公比是否为一进行分类讨论，特别是容易遗漏两参数乘积为一但各自不为一的特殊情况。通过概率和为一的前提可以求出各自的首项，进而计算内积。第三问是带约束的最值问题，利用柯西不等式可以求出无额外约束条件下的最小值对应于均匀分布。而均匀分布的期望恰好等于题目所给的限制条件，这意味着无约束情况下的极小值点刚好落在了约束条件的子空间内，因此该极小值也就是增加约束情况下的最小值。第四问反映了针对给定对手策略的最优应对思想，当对手给出的概率分布已知时，玩家能获得最大胜率的策略必然是把所有的概率权重都集中在对手出现概率最大的那个选项上，这种最优的纯策略的胜率是一切混合策略的上限。

ふろた

Explorer

0185-2018 东新复数学 P96

ふろた

Explorer

0185-2018 东新复 数学 P96

0185-2018 东新复数学 P96