优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
; g _# V0 b3 o
& o& A. g. d' A$ k: }* I( F
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
* ?1 c0 P1 O a' T+ E( {. O
: c* z1 j1 P$ i1 G
问题
* S0 v6 U* J+ W/ u5 ~) O
# f# H& g! N6 b- E
& L" ` O' Z: p, O7 m& v2 @6 n
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
- c( ~- m$ ]' P3 `
: c/ c' \$ U% k3 I8 y- t
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
# {8 D- f7 I% O3 L$ J; g; R7 |2 r* n
, {) {( j7 p7 Y/ A3 q; d
本文
/ [9 U' J' ^5 T" ?' w7 P& \
& e9 d7 v. ?, U# i- o0 d' t
$ \2 @ n5 w& ?( G6 L
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
: |8 l1 q# t: B& u; Q
0 A0 U# H6 p, c7 l8 z* [
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
; p$ Q( S% m6 D2 B& e) n
! H' Y4 W6 q% w+ @) J
9 G4 z a- d7 {% t* V2 c7 M/ B' ]7 P
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
1 D3 D A1 C$ U! |# ]0 \
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
( {/ \0 M' d/ z( E7 N
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
" @& ?# O# Q0 ]; D( y. E
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
) t- }7 \: i, |2 l( v, b$ `
, L; d6 N1 p0 _% O p1 W$ m; f) b
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
. ?! c7 L: _8 d& Q$ g. ^0 q
7 I8 ] B$ ^2 h1 ?
++,
' g+ _- x1 {# y$ w2 O/ q. }: B
+-++,-+++,
( ?; H; x5 S+ _# ^' d
+-+-++,+-+++,-++-++,-+-+++,
) l' D) f0 m2 [0 C
。
4 Z# `4 O" n; h/ p: ?9 S9 M& l
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
5 J$ b' _% p t
1 F1 v% V" A! o& f. |# X
6 r; T8 c2 d% U' _- S( g0 }7 X
3 R3 s1 |: V$ `/ s; b8 g1 O& y9 D) E
d. r' H4 C2 N, o5 n
3 v7 A4 U: ^& P5 d; {! ~
( D! o C% W% n, c: Y x: @
; \, x K3 R) ^
. K9 s% Z4 S1 G9 k* ~, V1 h8 ?
, ^* k* k! e% g; R
* f9 D1 u, S7 r# p4 P$ y! ~) O
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
* @/ b" g3 t( {
0 N& Q' q) f- ]
++,+-+,
" h3 z$ A9 ]2 }8 x, S! R& V
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
" o# O/ F. Z) E Q+ a- |3 g
-+-+++,-+-++-+,
, k( T# m' ~2 g7 U& ~8 G
! L0 `1 f7 B0 |; y% G ]' O- I# c
, ,
_% B# s+ t; s. z- r
。
7 q( Z, x: d) E$ l* _" j B
- F3 }7 z; ?; _; b; W
仿上之计算,可得此时甲赢的机率为
1 g# A5 y* v, g) z4 N6 p
8 P+ q" D4 D# ]- c/ j$ U
/ ~' m# f a) B1 }& e- D
- N, a9 }* E- g/ W- L- J: X
% \# n8 d# q( {, w) j2 p) J1 F
; E! I0 {0 {! x
9 B6 w/ B4 |) M5 U- G& s. W" ^( i
) Y7 v# |" _; H$ Z4 m) b
2 T, D/ h+ c9 k+ u. E
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
* t/ A$ X. c! I8 `
* @% }) q9 l* k4 C1 ^
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
: @' p0 \3 T _3 w Q
% M4 h& C. C/ ]- m, f) x8 \; P* h
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
- T: t0 L; g. G4 }; o% N
9 L8 H; G+ b1 H. v' n; V- m" Q9 h/ L5 G
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
, z4 S# P% C, [9 o4 [- w7 [
7 H7 C I9 ?9 p; |2 `7 e8 a
9 F* m& m4 A& ^. n @" S
情况一:
0 ^% v6 Y2 d u0 A2 F5 i( R% ` l
此时不论甲如何下注, 恒等于 c/(m+c)。
/ n/ P6 W0 T* I- L/ |
3 R2 ~4 s) T2 @% b5 p7 S1 B
情况二:
7 C3 \2 c& C! G1 ?
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
* g3 ~) R- t4 D8 ^9 e
6 r. ]8 q6 [$ G' @
情况三:
! z/ T8 T! `- l: L- P
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
1 c; t3 S; z, I6 n
+ v' N$ J3 `' _* v ?3 u W; W
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
" q1 L, v4 m. A0 T1 _/ P& Y0 }
7 k0 E* Y; d ]/ M& P
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
: f: t2 _& L6 i& {+ _1 s2 H
+ G" [0 j2 j c$ D% h; \" X' l
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
6 U+ q$ b4 f- I
: G, c& D( K- F5 W# ?8 V! F
, e' g3 o9 C2 h# l. g5 }
情况一:
; E; V6 V; X( K
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
& l7 a2 v. T* j F L% w: Q ~
( e1 }8 Y; a* k' d5 |" \( R( {* l
- A# i- u* C% I
, i! |( a; B7 {/ m/ p+ z
I+ f4 r: |# V+ p) t" W
4 k& I; i# h( X* W8 E
w+ _% l" ]* w! O* [2 f
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
. l/ l, G4 p9 M# _
) T$ \% ]9 t$ Q6 Q; i2 A4 m3 W7 ?* n
情况二:
$ m# A7 o2 M4 d9 d' e; ?9 F9 E
令 q=1-p。此时对 ν 我们有方程式
% |$ F8 c' h k7 Z& q: Z/ h" j8 A- l
% R3 C8 k# e) L9 u1 n0 _
0 x3 J' R' t* M1 K
! B+ ?" ?' X2 H( J. K
8 U: f! V C2 q0 D) T: S
8 j* {7 t6 U) t
; f2 d9 m% e/ o' O' w. v$ S
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
/ L9 L4 a4 o! ^1 i
利用p+q=1,上组方程式可改写为
0 A, F5 R5 ^; J- `; ~# {
) x4 I1 @1 D6 N e9 B k4 J
- Q$ ]7 W2 s" y' c& p4 _1 a( }& x
# n2 {; _/ m6 f% }" c
0 K$ ?; x6 J, i6 G7 S% y7 _
: {, }# q. Y4 O; n7 J9 Y/ N2 l
) o- E; j6 K5 l! f) j6 L( o" b
两边相加,并利用 、,得
1 q( `8 T7 n7 ~7 {
/ Q6 y1 n" @- `; ~$ p/ n8 e F
6 S! V5 q9 M8 H# e" ^" z
7 ?3 h- H" l% k# Q1 d7 I
. U- g4 N: a, i ~- t
$ D7 Q1 r. e Q, g3 ?' X
2 x4 U8 ` `9 F
若取前 c 项相加,则得
^" h1 [! j& i+ K
+ x7 n2 f6 a6 Y v
3 O, n) v+ B1 E0 h% |
7 ?7 [& I' ^4 |5 E* \; s
, i( o/ k0 a3 P# [6 N" p! a
# s4 h8 R: O* A* P* w
r: O6 c! c7 G v. Z6 U) w
情况三:
/ I' d1 ~ g2 u" ]
仿二之解法,可求得
& [- w- x3 }+ w$ [
% a" {2 y3 n' s) [! \ s X: S
4 d& e0 w! d0 U- s
( M" x* p8 z6 u. {# `- d, N
6 o1 V: V, q, {/ J
+ n. m$ y& p# e# ]
( q% c3 q% L0 ~8 U
9 D* x L1 v9 f" B3 g3 {
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
, J+ q6 r7 E! l! J* x( o Z- {4 \
+ r3 f6 Z, a' o8 o6 n% ~$ c
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
4 ?5 T/ D% J ], c( Y$ h
/ D6 y$ e) B/ m: _0 _+ k
9 W. h J2 V s
定理:
: m5 r+ I: y2 o/ C' g9 r
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
$ U# J3 L$ t4 ^* @. g# Q
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
+ L9 X4 x5 V% w
6 s" C. T( F; V3 l1 _: ^- l. E
现在我们就拿这定理来证明先前我们所下之结论。
* F' ^+ E& ^1 I/ f6 }
+ j( E# w5 z1 P# e' u3 {2 T w& O
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
) N# T* H8 E; d9 d3 U
6 c0 S" q3 G, X7 B" L9 {1 W+ J
至于在情况二或三时,我们取 。此时若给定 Sn,则
5 c5 U. p4 i2 K4 K& G
: d: g: o% A7 Q
4 P5 D4 B8 t" Q0 f: K7 C( E5 [+ |
, h c, }! q0 @' X! z
' q0 C8 H9 e* I+ Y& ?( i
9 ?2 ]2 _0 Z" [8 l6 U
6 L* N9 R% }0 L! u- x
# z$ ?: M3 i+ |& F) M8 o' _6 _- [
9 i" f& C% Y# x& m' p6 |
其中 为所下注之金额。利用
9 D* Z8 q. h: A2 J+ H2 G
# }. o" C N! U. k# D+ r
1 x% U$ }/ W( A+ L% e4 D- o
4 K* g0 Q$ c. e
7 U4 s; Z' N0 d/ {1 ^5 M
! A5 K: h0 \' t% f L
( S6 m6 |/ G h n3 G' a
4 B* W% L+ D9 T/ v1 n
* y- F$ K5 x9 m W
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
* Z! b. q% r! \1 A* X$ M ]
+ X7 C) P/ r2 N4 k( ?7 |: q" i* q
$ m g3 r4 u6 o& A
$ }5 ~2 v) i: B3 A1 J# }" M' p* ^% g0 U
/ ?; b0 f4 m" X' b# i
- c) [, I8 w, E
- _. E8 J. n% ~6 G) `( j
( N9 b, t4 H( A6 ]
) Y+ \3 g; t1 `' L7 r" I
因此可得在情况二, 时,
% u0 Q+ W6 m5 l% A
$ o9 n) O# F: L% O: v0 c
/ y S5 `; W5 J4 n
; }5 b7 k/ J9 y. Y, h
7 c: ?( d) ?9 H3 n+ `; @1 T# {( N9 d: o
( f6 U0 m# n+ |
8 I3 J) n. P1 ^- s5 d* ]
3 U6 w6 \' W: S
# v0 I. g( F0 v* g( ~4 i
而在情况三, 时,
6 V8 b8 R0 L4 x7 y. D
& J# b* t) _( u' y4 e8 S* J
: R7 U% v7 }) J- x
+ j9 E& _1 P3 W3 n
0 e0 W' x& ]' ~& ~. k
0 o$ S& ?/ d& E2 t$ p
8 C5 ^! F7 V- F( n! K3 o+ f
4 d: b* j/ V7 N: c
0 F- x; @" m ?! p' g3 r' D- r. y; X
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
! V, G1 P& ]8 z% Q: [9 k
9 [3 y1 n6 y G0 H) T
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
, i1 I/ d+ t5 o% c" A6 \, ?. L6 ~9 O
3 Q5 m& |5 K! o/ V+ T1 G0 {" q8 e- U
附录
7 A7 n, U% Z- w# K' y. m. Z
; C( K1 |( ]+ l2 B9 X! E$ c/ R4 I
1 i" Y* x( h3 S- G
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
# g# v0 `; ]! f- }' f5 B% \
. J: O7 W! v3 ]7 Z% \
* g( P$ V9 L! M
# P5 C+ @1 g. J# h! ~% ]
! N% ]1 [6 j9 ^( Z6 x
5 w* S( v& {8 j; r
+ Q1 p1 [4 n% d1 O; C# ]
' e! D: `0 C" [5 C8 v2 {
4 g6 W3 T0 o% ?
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (https://tcelue.ooo/)
Powered by Discuz! X3.1