优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
$ u" [- W) z+ W) Q
! v4 k0 g) S3 _8 Q
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
% R# K: C* G) F5 K# ` g- o+ ^
2 [8 W9 b; x0 Q( y5 U
问题
7 y& ^2 T" q7 r, X5 [
* `1 M; H6 F. l
! Q( A+ a2 j: Z+ P
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
0 ?" S) i4 g' v& i3 a6 ^$ t
9 p* I: g* g3 G# v( D- d/ ~* H% I
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
4 S" ]% B o7 @" g/ P& M
' G3 d+ B5 O; }3 c
本文
4 R% h3 g' w# [/ Z) k2 {$ Q
% M g- f7 C9 j
* n# b# M/ z2 @* c
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
: J/ D0 D! \7 h2 E' j& s" N
: S3 i) B g( W2 Y, k$ |0 e
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
: c @$ K7 j- O5 {3 @
8 s/ }; s2 Q: `, o; }# k/ b
' R% k: W' M, ~! h, J7 @% F
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
3 u5 _; ]; x: A
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
0 I4 N! B3 x1 s L
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
* u6 ?* t! B( |
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
+ l C+ q3 R& P& b# T+ w
2 @4 ^, f a5 o
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
7 r3 x0 Y% R& x
* g9 Y' w: P- k0 V2 V/ l
++,
( D3 c) d7 Z7 J$ j2 i* Y
+-++,-+++,
* o7 @* Z# A* A' B, L, x! K5 K
+-+-++,+-+++,-++-++,-+-+++,
' E( o! j' |% E3 b' m4 q
。
6 [" W. d; x+ G/ `$ d% d( { F
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
' U5 b0 T0 \, G% D9 t# \$ [5 Y$ ?
. o# L$ X/ b6 i+ X p( Q
; |0 M& j9 ]+ |. o$ v
, r- x5 l- C" d
3 K/ u0 _1 m- n; W/ G
. [* E+ G1 D( m; G/ q0 z7 \" A# f
0 [2 \- t1 K$ J. o
. _" C F: U0 I, }- T
* X' a; `- ], `
: N! a+ M. ?: f% u
0 B6 h/ i# `( Q% `% D: X4 v4 H
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
9 C2 ^5 ]. X L
$ M% w7 P/ F) I
++,+-+,
9 k) |. s7 d- t) t$ a% \
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
. |4 `7 V0 p! i# T& b
-+-+++,-+-++-+,
8 f4 Y) `) z( B2 X% w' B
4 R3 x& P+ W; a$ W- Z: U
, ,
( A/ W" \! X) G( g; N4 K
。
7 r: R& m9 G! T y& k3 t% e7 F* B
( m6 B0 E/ w, a+ J+ x3 b" x& v
仿上之计算,可得此时甲赢的机率为
1 ]& p3 f# h& P5 Y$ h( v, }
5 B7 Z6 l* y' Q+ h2 G' R
, G$ t. x# a5 A
5 c+ j# Q, t3 A. F9 m
, ^/ D( S$ T9 r+ [) x
3 h) Y( |. Q+ ^6 Z+ J
$ F- o0 @0 J) ?( Q* g2 K% y
# N' H3 ^% j5 u1 I4 x' v
9 z: h2 t2 b9 u6 p% T
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
. ]; G; S$ i3 J
; a. N7 J5 H1 N
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
2 ^5 Y# u$ ]6 n$ H3 G- O, K: R
( d! {' K# x7 A5 k+ ]
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
' G0 G. Y& Q y$ U
2 c: e2 N5 o6 l8 M/ k W
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
1 T) z! u6 k4 ~
Z" C! F. F7 P7 o5 S+ [$ y
8 m: l$ X! Z3 S. }
情况一:
; f( ^, Y: n: @
此时不论甲如何下注, 恒等于 c/(m+c)。
! Q1 ~, L/ w N& X# {
/ I- P z* y5 r/ C/ \
情况二:
' t0 Q# g( f/ L; R- Z4 V
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
4 z4 h8 Q# C' F, M5 o' f
/ S( R4 Y" b* V1 {
情况三:
, P* G' Z) i$ K" P# m6 R
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
+ b! W& D7 M. j9 R. e; N3 [
$ M0 J- b8 r4 k* B4 v
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
+ W5 Y+ d, ` M. v
/ w& E# z7 @3 q4 j) \+ E5 z+ B2 ^3 f
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
+ a6 U2 G! g) W- K) j8 @
9 p: m% W5 a; `/ m. D
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
% a8 ?# z" ^3 v7 n; g; ~1 d9 R
3 |* b0 Y: P% G/ i9 A7 ?/ o" I
3 K' r/ f1 P6 v4 N
情况一:
6 R# o) c" R$ G
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
- T, C: W# t7 U& ^6 _+ {
' d5 y- z0 h7 T" {& V+ X7 R, j
n. M9 I% k) {, x4 ]* y6 `
# c! _" y; s$ E, i c. `8 w) R
3 ^, P; @2 d2 g8 c
* s& R5 V, T; B H3 B' L
: w1 L; f# Y; m2 ~
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
8 l, @5 G2 Y' M3 O+ \
2 P- Y) v7 O9 Y. Z o
情况二:
4 C. ]! Y/ U% c, _& m; O
令 q=1-p。此时对 ν 我们有方程式
+ X- I9 u1 @2 b1 D* U
9 `- L3 r! t- x5 \9 {0 ]
& A: P _& F4 ~5 T7 e Y ~
! k& e1 H" i% ^0 ~
8 T$ D. Q; S7 S1 c: R8 I2 x
1 D9 d& F5 `: o
+ m7 g% v7 X- x; P* _
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
6 h/ ^9 _" g& R f8 t) f
利用p+q=1,上组方程式可改写为
6 g) v) f4 t7 `4 n
1 [2 [3 t! s8 e
9 a0 N7 n9 e9 v8 X7 }8 b% \! S, z0 E
* v( f b3 V+ Y" |3 T/ g( g
y" G$ J( y9 P1 E
2 x3 ^7 G% V { D P, r$ L
) p$ A* e2 K; ?# I% ]6 P
两边相加,并利用 、,得
Z$ B8 h9 v0 P0 q
/ o% f1 u4 S# J& g) x2 \
: j2 ^5 n. C8 n5 z
- M; x# y' l7 J, Q9 w8 {
8 I( W: Y9 y& Y: e% W( Y* @
N: _8 O" ?* `4 Z
) P3 Q' b/ n2 n6 Y3 x
若取前 c 项相加,则得
) v# [3 X& A- v0 x
8 ~6 w! [* d) g& n
9 u, q1 C$ z( T6 V* B1 h
8 C9 S6 |9 [! f4 D% g1 _
" ? p8 H. m2 Z& ?9 `8 [
/ N1 g- h; B% g: M) c; w
@- @# m" M4 U4 D
情况三:
8 p: C. }( m- P0 Z7 J
仿二之解法,可求得
, Q" Q# K5 w; Q7 U8 i7 A! q% O7 Y% K
& k3 |6 u# o& D8 _3 f( q7 u5 W6 v8 i
3 x! a' @; K; N a1 U" E3 _
# S. f r* P# g! E
+ h# v; _/ }9 E, O4 m
# X% [1 ~& s' L8 q0 G9 P3 D
4 j) j3 V& J) m$ V3 C
: B* E- t" B' L5 T: y" ~# x
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
1 _7 [" e% ]$ q& \2 ]
7 a9 D" W: p( t( Q
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
! z5 H0 M2 v d/ q
" i, p- k' k& j* y, K
" o% [% I, L+ h& ]& A) \2 V! j
定理:
6 \* P- m# \, j$ H3 q% l
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
* z k2 t, }; |
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
7 Y" I9 a* k$ w- z. @ n
2 b/ l; v9 A9 u* M/ c
现在我们就拿这定理来证明先前我们所下之结论。
" W$ w% F5 I! |
2 t; g# @+ i0 d+ D, s% C
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
- P0 q# f- o1 U8 E6 w( G! s+ H* N# \
; j/ y# U+ L4 i( V, c( B2 U8 c
至于在情况二或三时,我们取 。此时若给定 Sn,则
7 \% X7 E8 X5 b+ A h* l( Z
, K/ E# ^& x& G3 s8 I5 r( f2 i
! L1 q& x. o5 @3 w
- v) Z3 C8 r# \, R" B
. ]. t9 K/ L: h" V( X
; g6 c# ]8 b7 N: B0 v0 N' [4 Q
) k. H! C- F7 r* b" A( C6 ]+ v
/ \) @* [; O% s
$ E* b/ c; @5 m. U, _
其中 为所下注之金额。利用
9 _ J# y$ d& L; R* l
" t5 r7 \" b Z* v* M/ Q# e5 ]
* V. i& I2 ?" R
$ ]% K D, a B# B
: `- |2 t. s _' |1 h' T+ R5 N* y
9 i2 n: A1 d" [& l
2 o' i& x& @$ b. L s( k2 c& N
) L2 E. I2 O: r+ w( W* R, Q7 e8 M
' H; Y# e; h. {/ Q6 |. w2 T8 u- k
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
* k z7 _2 N2 `' P) Q
S; t7 t: T/ t; j9 L
! p, P% r8 P% L" I4 b
0 M7 S" k1 t6 | _
6 k9 I, C$ ?" n7 P. |; u
8 Q5 f! H7 K5 c& I
! w7 G7 Z" @+ K) B$ t8 G& ]
( q. z" Z: [7 E% Q
; L' x1 P/ y+ w2 m L' u
因此可得在情况二, 时,
/ ?9 o5 H1 x' r% j+ N0 y2 s
Q, I. L9 q' T7 L% e
, d" F9 v5 L+ H4 x
?" s; A( K/ i- U6 C
2 s, m7 H) s5 d J; y( T
( t! g$ I% M- H" Q( D; c
" U" K9 l; i+ K u: }; o
6 G/ C" F1 L. U. ?8 g- ~
; e* s7 r3 ^2 x! u3 ?
而在情况三, 时,
( g- r, z' l2 w) D
& e# Q7 a8 _9 M6 r6 M9 A
, F0 q9 I6 ^4 P# t+ `
% Z$ V9 d R& F+ S2 N6 n
6 C8 Q5 a) q4 z: R
( t6 N" R: T% U; r! i! f# J, A3 l* G
% e& a2 T3 y, L+ \4 L: Z: o/ |
8 C! Z; i5 m7 I% G0 e. J
2 m* v1 F, g. U. R2 C0 b- l' Q
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
8 M: X! \9 k M# y, n5 S
% a( m( E) d; t9 j: k
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
2 M" y7 F0 l7 R
+ x* ~# p/ c7 ]3 c U
附录
# ~( c4 t: i8 ?. x- Z5 ]- O5 n2 h
8 z/ \ n7 C( ?. w! r* p
, o2 W9 P7 F \! h3 ?! K
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
! X5 r2 I0 C: V7 ?5 E
y$ v E: e, L1 R
4 `5 Q( h: m5 D4 U1 W
5 h$ q4 C7 \& p& Q! n, l
) q$ M4 i. Y- z8 X+ X7 Y9 W4 ]
0 g5 i9 T! _0 R ~1 W+ ^; n
) ^# K3 k1 _4 z8 n
2 S& j P1 N1 O* e0 {6 _
) k3 ~) H2 I: v* [8 n5 }' D" Y
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (https://tcelue.ooo/)
Powered by Discuz! X3.1