优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
% Z. E4 ?) ^" u9 M# F/ I" j" X
7 h; a2 y+ W2 I7 R3 ]
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
$ A5 j# V( Q9 k4 x* T0 _
+ E1 Q( }# y$ @& y! E6 ~
问题
2 w8 [ B1 g% Y) `
1 F% v- t8 j. I+ Y4 x( Y" ?) p- P
' [+ L5 o3 b* N4 \
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
8 g3 ?* J* x$ Q* r: r# S
) c& `3 A9 x; f9 K8 t, ]3 }
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
0 l7 g; z; N5 J5 P/ ~8 H5 D$ V
: I; Z. ]: s9 y( b2 S; m5 w
本文
0 l( z0 T- Q, |
- `+ X* \2 T/ Z) f6 M- f7 [) e1 r( Z7 a1 h
- u& r* F l3 _% f/ ^# q* n7 ~
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
7 w* Z/ ^4 E5 H7 ]" ~: o
: Q2 J, T# U# Z& X8 r* i. b: w
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
7 t; R& B- x, r/ v8 B+ a8 v
" `) h! m5 B5 L$ [ `* X4 v
. `: d% {( \( f' z
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
( I" p1 |- J# O6 T$ r$ Q( \
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
" u6 F$ q4 Z7 k7 z ? K
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
, N8 [5 B/ Y0 A J8 T) g$ B! |
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
4 a% Y+ \1 `! C* M0 J& G( O
& E- d$ C5 C* @- l! q
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
, C1 M$ C; i N* r9 i" b
; U* F: F9 {2 @
++,
* t$ D$ D; `- L
+-++,-+++,
+ Z5 S7 ~0 r% Y+ @" k! R
+-+-++,+-+++,-++-++,-+-+++,
4 O( K' E; n# T0 Y; b: p
。
( \! @# N! u8 ]1 p7 H
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
2 g- `+ ]7 e$ a/ N! {9 G4 ?
; J; |; v5 `/ F% k9 @
$ v2 ]& N; Q9 I3 S7 [6 w1 Y9 P
5 _+ b, L( E5 p& H& Q+ t1 ]
7 G7 @* x( P$ a4 [, D
* _; I. V- _4 h3 h( G1 [- Y7 D
7 t" m k: O1 j. V5 `* K) q
; r7 i' M/ ?) H% G4 R3 W
, f6 m6 i7 b" {2 ^$ P/ @, A
, l6 R' k8 w6 _5 S% T
/ c3 Q& W; l& n M) J: q' O
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
) Z! t l3 l/ _3 r* V* [% M
* R' t% o. x8 _6 K9 y0 b2 C1 U* q
++,+-+,
6 z! g* {, m! o
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
6 J7 O3 T+ l) y& w
-+-+++,-+-++-+,
9 X$ w4 q$ E0 c- O
r3 W5 B. _! {0 h# b
, ,
, e9 G; {0 u, o& p) b
。
6 s- F( G) p- q5 _7 Y) B
9 v6 V, v; x. @: I
仿上之计算,可得此时甲赢的机率为
! M) u" S* w8 z; I) ?
+ m$ B: w: W. i: t% ~7 ]2 v
& V, Q( H g) X4 N0 c: G
: m5 |1 D- n: s% Z
$ i( J2 O B! S
" M- L/ n9 x) F. n6 I. o/ e
4 E, U( P4 y5 R/ m- |5 g1 K/ g/ ]
5 M2 U0 X; f2 g! n6 h# P/ l
, T/ e# e( y) Q8 M
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
8 v; M; |4 u- ~. C# x0 _- ~" Y2 X
! m7 Z) ?. r4 m% x7 @3 A8 P, x
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
3 E' N; J$ Z- d' |( h
; I; x2 j( K2 a9 L
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
$ b$ H2 I% b7 ]/ |
# @( N$ X& I- t* s% N8 E
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
) d; o. ]; m+ m" ~; y+ R! ?
8 v) \' N. b' z
+ _# P/ F9 C- C: c7 {. f+ M5 x6 V+ t
情况一:
7 J$ r, W9 W0 J- i; |! \
此时不论甲如何下注, 恒等于 c/(m+c)。
. O3 H X+ o6 S8 s2 [* z9 x
$ |% r3 w) q' v' z- T. ~
情况二:
8 \! q7 h+ n, O9 O2 g( F# b; U
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
* a+ z8 f) I9 h' f
, s- d, o) o$ Y" G5 e4 |* j9 j
情况三:
- N# @% Q$ ^+ k* Q3 S M
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
$ K. {: m6 {( y9 H
7 W6 r, x+ y9 T+ \
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
]% @/ ~. b `. Q
- v1 q: ^# N9 w& a7 s
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
5 Q2 I1 e1 m" h+ g! t l% _
; {" n/ y% I. E# i; N) l2 X
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
! l+ }% c8 v4 [* J( I( u/ U( f
2 Z- K! A4 S$ k% [; z* s* l
/ ~' j8 l/ I; R2 q2 ]* S
情况一:
) M6 Y& j) _5 Q
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
- j3 V) U% ~" O! x) E, ]
1 y9 e$ m, K4 T5 K. l
4 ? Q& J- b+ A( A, T
* ^- B! S7 V1 o) B5 g
5 P7 W% E7 w5 x# X U- z1 N
* b c% ? ~) t, C7 \" B5 V
8 t" k& O0 `6 p8 B' r
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
9 I) m6 v' E/ ~4 `9 @* P* h* S
7 S* \; y4 e( a, d: c$ |$ m1 c
情况二:
1 r4 S8 ]0 ^9 X! t. ^+ X
令 q=1-p。此时对 ν 我们有方程式
1 I$ P$ l, G$ i* _7 `; }0 o
/ r9 b/ ?$ t- t% z/ E2 S: b
+ j# R) _* H$ l/ \$ c* f
' u) Q# [) j! p/ b% i8 c" J; q, b
2 F3 @* ^8 `4 |9 {/ G+ t( m
0 m" z- z+ H8 K
* e: T: r3 b6 G6 p1 v* e
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
- f7 B& n8 }. j* ^9 Q
利用p+q=1,上组方程式可改写为
/ ^ Y: @& P/ e5 R
9 b8 F5 p+ N, @" p
1 ?- C# R, w0 t, n$ n5 g
- I. }( u1 Q; y# v* y
5 |. S; \- Z Z9 v
/ G: z; J" Q+ I& e
( O: j; i( a8 `9 W( {
两边相加,并利用 、,得
9 ?+ A& Y% A6 q- F
3 B; A& T( M# x3 i
4 R$ l: s! u5 c i2 f2 l5 S- T
u# q4 a7 ?+ t1 U* `6 [
7 u4 k7 R9 T. t9 J8 ?: m# R
+ F& t( |# t+ C
6 A' y+ p4 R; l$ j. C" A6 U( i a
若取前 c 项相加,则得
( e2 U; A6 K! r9 Q
7 ]8 n) c& G: b, G$ @
& n5 y3 O( C y/ M q& P7 t( C
' \) u* c8 ?+ e* @/ U8 a: M: f) e d
- N+ B+ D% l* b- V( l# N
2 H3 H% | @, g" Z& A
$ O! y3 h1 o0 ~, M
情况三:
! v: z0 ?5 X9 K8 W! s% }- o
仿二之解法,可求得
9 z7 V) Y9 f# X- X. Z
$ D. y9 g7 f, u) r2 E. B
, V6 @ Q/ |- d4 A, j7 Z
! \+ ^9 \8 j* f+ b
8 Z8 B( ^# Y' ~; u6 l. q' U+ t
0 J: y4 z) ?; x9 P- E0 T z
# `. |3 n+ ~3 C0 X
& y, @; b6 Z" R9 Z% g
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
: p8 C2 B5 ?; G) [
. O" u. p o7 \; Z) E4 S$ f) S
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
$ @- [2 ?7 h/ O/ s) U! Y
7 H; v/ X3 @: Z- f
, ^4 c* n9 A; t+ S! [3 q7 y
定理:
) d, m* C1 w" ]6 W5 h
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
( S7 d( o: _5 \3 w8 p% c" E/ x
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
! W% s5 @1 Q. ^% }; o% z
' u Q0 |2 U5 u+ h6 c8 g- o9 N
现在我们就拿这定理来证明先前我们所下之结论。
# F. O1 B0 h! E5 z
2 U( j- X' T: P; Q, ?+ u
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
( b9 T: U& H v( {
; Y/ B2 f1 M0 H5 |, q: p) B
至于在情况二或三时,我们取 。此时若给定 Sn,则
! w- J* B3 W% W2 |
9 h- `7 z; o6 I( P
6 A" K, G8 K) |
' ?1 b/ c( B `5 c* ^3 A* S6 [
' s6 O: j# O _5 @
) U7 o) M( s9 I5 {
& r' M, V; T# D* L* _. w
; c% E9 t/ x3 ?5 ^1 m# J0 ?
7 C2 ~! U* s- b( O
其中 为所下注之金额。利用
( O) Z) C- Z7 `! [0 |. {# C
, ?; b4 I5 ]) O
' i0 Y7 B( [0 g' t7 k
' I( o+ \) N) R9 N
4 V* j; X- l& a# C
# D J1 I0 m0 e% [2 J
( q+ S6 Z) L8 h4 A
' J4 \, G. i6 _& b& X( w
9 T1 U1 _4 n7 h7 m! O2 ], y
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
- G) F- Q$ u! y: b8 R8 |$ B- c
& v) }4 i" b( @1 r! u3 E$ i
4 w3 \4 P) s7 j$ E9 l
; r7 B) Z0 B- f+ M
, Z# u6 U9 n( ` S. j
( ^' y$ w# F1 ]0 i/ j1 [. K: K/ ~
. Q; |; c3 J6 \/ m( \
: B9 P0 x( O4 g1 {# E J0 ~
! q$ u0 i; D% E) h4 Z4 e/ V% k
因此可得在情况二, 时,
; n/ M7 ?4 A7 P7 P' w8 }
9 D" G" _& Q4 {8 z4 q* }9 `& h
: Q- E9 U' D: r( d5 V7 F
; F3 C4 H+ |8 g2 [; n3 t
, y9 v' q( J) U) t
: `5 {% P6 ^0 T! |; o; R, @ c
- e9 z) Q" j: {
- v# c8 |# ~5 Y, U' i6 ]) m
: M/ ` @/ N0 q z5 ` E
而在情况三, 时,
+ n6 u. f* [" O1 B" c3 e& a
( D) I# ~: _0 |
. r7 x, o% h" q, p% n0 t' @
9 d ^$ r) |+ h* Q
1 e/ t8 Z: Y4 `- d. k8 M/ X) U+ \) d% n7 a
9 k8 l+ f8 G/ @6 L' t
6 n" A/ W7 N$ Y$ Z1 H5 e3 ^% e h
. x1 {. ^ g3 N& Z+ _
! X) J" o* O. m4 J% c
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
R# N, K* J$ t, k/ F
: @9 Y) ]" s& H9 G/ G: p0 K* M
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
' z. u c3 b/ V
# h& P% r4 h" [) i
附录
: M9 b0 j; b' \5 W2 W0 H" r" e1 i
6 T! S# |. l1 J# F
$ P" B, W6 @# K6 J% D
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
% {- k7 f) ?0 Q
# v0 ]1 h) @% l- N" w; _
# D" p0 h- M, P5 @# M3 X& c
3 }1 o& o( n7 g3 o( L
% V8 y- N9 Z# D+ N2 @: O0 `) G
: W5 n1 h$ x9 t" P8 c3 w) w7 X% _
& g1 Z* K3 x1 w3 [+ O
0 p) }+ _( F9 r8 H/ @
( U9 U0 m' N T0 p
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (https://tcelue.ooo/)
Powered by Discuz! X3.1