概率统计 马尔可夫链 随机游走 赌徒破产问题

A,B 二人が合わせて 個のリンゴを持っており、ゲームごとに、勝った方は負けた方からリンゴを 1 つもらえるとする。ゲームには引き分けはなく、A が勝つ確率を 、B が勝つ確率を とする。このゲームを A または B、どちらかが手持ちのリンゴが無くなるまで続ける試合を考える。全てのリンゴを集めた方を勝者、リンゴを無くした方を敗者とする、また、A または B がリンゴを 個持っているとき、それぞれが勝者になる確率を とする。このとき、以下の問に答えよ。

(1) および で表せ。

(2) および を求めよ。

(3) 試合が永遠に続く確率が 0 であることを示せ。


解答:

(1)
ゲームに引き分けはないため、 である。
Aがリンゴを 持っている状態から1回のゲームを行った後、確率 でAのリンゴは 個になり、確率 個になる。
全確率の定理より、次式が成り立つ。

(2)
(1)の漸化式と より、

境界条件は、Aがリンゴを0個持っている場合はすでに敗北しているため 、Aがリンゴを 個持っている場合は勝利しているため である。

(i) のとき(すなわち
数列 は公比 の等比数列であるから、

よって、 のとき

より、

したがって、

はBが 個のリンゴを持った状態からの勝率である。AとBの立場は対称であるため、 の式で を入れ替えることで得られる。

(ii) のとき
となり、数列 は等差数列である。
より、一般項は

対称性より、同様に

以上より、

(3)
ある時点でAがリンゴを 個持っているとき、Bは 個のリンゴを持っている。
試合が誰かの勝利で終了する確率 は、Aが勝つ確率とBが勝つ確率の和である。
すなわち、 である。

(i) のとき

(ii) のとき

いずれの場合も、試合が終了する確率 は常に 1 である。
したがって、試合が永遠に続く確率(どちらも勝利しない確率)は である。
(証明終)


本题考察了概率统计中的经典“赌徒破产问题”(Gambler’s Ruin Problem),涉及随机游走和马尔可夫链的吸收概率计算。

第一问要求写出状态转移的差分方程。由于没有平局,单局胜负概率之和为1。通过全概率公式,从当前状态出发,考虑下一步胜负两种可能的走向,可以将当前的胜率表示为前后两个相邻状态胜率的线性组合。

第二问求解一维齐次线性常系数差分方程。结合题意的边界条件(持有0个苹果时意味着已经破产,胜率为0;持有n个苹果时意味着已经赢下所有筹码,胜率为1),即可解出特解。需要注意的是,当单局胜负概率相等时,差分方程的特征方程会出现重根,其通解会从指数形式退化为线性形式,因此需要分情况讨论。对于B的胜率,只需要利用对称性互换两人初始状态和单局胜率变量即可直接得出答案。

第三问要求证明游戏必然结束。只需将某一时刻下A最终获胜的概率与B最终获胜的概率相加,通过简单的代数化简证明其和始终等于1。既然必定有一方获胜的总概率为1,那么永远分不出胜负(即游戏永远无休止进行下去)的概率自然就是0了。