优惠论坛

标题: GTO(传说中最优游戏策略)之---基础篇(转帖) [打印本页]

作者: forgetfulove    时间: 2015-4-17 11:10
标题: GTO(传说中最优游戏策略)之---基础篇(转帖)
        GTO(Game Theoretically Optimal) :  传说中最优游戏策略。 但不是最好的。。。为什么叫最优呢?相对于你老是输钱来说。它确实最优。。因为它能让你不输钱。     那什么是最好的策略:EO(Exploitatively Optimal) 压榨性策略。
+ `5 K' s; V1 X( f4 i; C# y9 c3 j1 u6 t5 w! A
        凡是有动态博弈的地方就会存在Nash(纳什均衡),德州扑克是个典型。 GTO就是指的动态博弈中的纳什均衡策略。这是个防守策略,永远可以让你不输,也不赢
) i- \0 P3 ?4 M2 _4 l
9 a5 o( @/ c1 m7 @        GTO最典型的例子就是 石头,剪刀,布的游戏,当你做到真正随机的出1/3,石头,1/3,布,1/3,剪刀的时候,玩足够多的盘数,你不会输也不会赢。  y9 [  M6 R/ M' [8 E5 g
1 B" Z& E! j- Z8 g
        但是....... 还有种叫 序列石头剪刀布的游戏。就是每次游戏,总有一个人先出,一个人后出。后出的有明显的优势。可以依据第1个人的行动而行动。 所以就算第1个人采用随机1/3的nash策略。他也死定了。。。这个更像德州扑克的cash, 现金桌的就是序列的。。总有个人先出牌。 后出牌的人有位置优势。& h# G8 y+ o' Z( c/ \6 k

. [( w8 r- J( p2 D. w        再看个游戏:2个开车的在一条路上 相向而行。 都往前冲(push),最后两人撞死。谁先停( fold ),谁就丢脸。。 我们规定下2个开车的,让有个人先行动。一个人后行动。 这个就很像SNG了。这个和石头剪刀布(cash)的游戏不一样。 cash是个零和游戏。而这个SNG,赢的不能获的输者的全部。 所以单纯的SNG是有没 nash均衡策略的。 sng的nash均衡是建立在icm的基础上。所以大家玩sng说的nash范围,是指icm-nash的正ev范围。
6 {$ e/ I7 q5 Z/ t: S8 Z& @' z! p9 z' _: G
        那么有人要问:在sng中,比如最简单的hyper-sng中,我完全按照 ICM-NASH 的正EV范围来打。稳定盈利么? 很多人都相信,82也相信。 不幸的是....我以前也相信。虽然一直有怀疑。。
8 a6 x6 N3 D8 |4 R( u7 D; ?  a; c) w/ I1 P6 U& A6 o
        答案是:hyper-sng的 纯nash打法。只能保证你不输。但是也不能赢。会输给抽水。 如果你采用nash的正ev范围打法,就算你有个对手每次只用AA和你all-in,或者盘盘都是用100%的牌all-in你。。。长期下来你们都不输不赢。但是盘盘被抽水。不过。利润还是有。来自哪里??  来自其他玩家的ICM-泄漏。  如果其他的对手比较菜,不明白ICM-的泄漏。。极端的情况。另外8个猪一样的对手一开始就同时all-in了。ICM的泄漏自动增加了你的EV. 这就是纯nash打法唯一的利润点。。并且这个利润要大于抽水才行。中高级的sng.多少懂点icm, 只有低级别的玩家才可能犯错泄漏给你。。。 所以这个利润非常少。。而且我曾经自己试验过超过5000局。% x; [- F7 G8 [/ I+ b

' o+ @. f5 o% U/ d: A% d: [) E        还有人要问:在cash中,只要是+EV的动作,长期下去,是不是一定稳定盈利。很多人都迷信。
; E, R3 \* K9 A7 i9 Q. |9 Z% A3 K) @/ W" `
        答案是: 不能。原因如下:EV分2种,绝对ev和相对ev,我们平常说的+EV,都是说的相对EV.必须有个对照物,比如这个Bet的动作,相对于check是+EV的。 比如你在 0.5/1 的局 你在大盲位置,用 5-4s 来保护盲注。你call的ev:-0.35.相对于你fold的ev:-1 而言。 你的动作是+EV 的。+的EV是0.65 。 虽然你还是会输钱。   再比如你有一对AA,是Nuts在river上了。你check相对于于bet 是-EV的。虽然是-EV.但是是赢钱的。所以。EV的计算也许可以让你少输多赢。但是不能确保你稳定盈利的。
6 P% ^/ D- I% F8 i9 n; Q4 Q+ }! ^& J. Q6 ~3 w2 @- w. p  N
        那么GTO-也就是nash均衡策略在扑克中到底有什么用呢?
2 B' O& Q2 u& o+ x; s3 |: b( G' G# {$ o9 _8 p! G# p
        一句话:GTO策略告诉你每个玩家的均衡点。 在实际打牌中你找到他们和均衡点的偏移。然后采用EO(压榨性打法)去压榨他们的偏移。; L, _% v, g! g+ Z( Z3 z( e( l
) k! k& A/ P* y# n7 O5 l8 H! ]2 S
        高手之战特别是单挑,2个人都不停的在压榨对手,同时暴露偏移给对手压榨。最后比的就是谁发现的早,调整的快。
6 _& p- D1 J. k2 r
1 m. K* A: V1 v3 ]        举2个简单的例子。! t9 Y, K" Q! t$ T) a
6 z" v! f4 k$ e( r* m2 q5 }
        sng中: 6人桌,每人1500的筹码,盲注已经到了100/200 ,我们是大盲位置,玩家都弃牌到小盲,小盲1500的筹码push你。call什么范围。ICM-NASH结果告诉我们均衡点是 SB push 64.6%的范围,BB call 39.7%的范围。。 这是均衡点。: Q( r4 P8 r& t3 `1 c0 L
& ^7 X+ u$ `4 A9 ~9 h
        但实际我们知道小盲偷的凶。不到10个BB了,肯定会100% push 我们。那我们call多少呢。。用sng-wizard得到 call 59.3% (J6+).   如果你没有可以马上计算的sngwizard, 那么最简单的方法就是,比对手的偏移量少就行了。 比如SB偏移了100-64.6 = 35.4%,我们肯定也要call松些。我们也偏移10-20%,偏移不精确没关系,因为范围边缘的牌ev值比较小,这部分牌是扔硬币的。 所以如果自己估算,call到54%左右比较合适。(wizard是call到59.3%)
% a! `; Y8 |' x- c7 L
$ D& ~  {# q. s& c+ H! v  G2 G$ x/ ]4 q+ c        cash中:      盲注: 0.10/0.25      底池 是1,手里有筹码 24.50  公共牌型是 A(黑桃) K(红桃) Q(方块) J(樱花) T(黑桃)   ,到river这里就剩2玩家。。 第1个玩家Push or Check ?   请先自己思考。。。。。!!! 提示:抽水是5%
4 ^; U. q6 A/ g' }3 j" I: [, @/ B9 K' S3 h. M' S# v
        答案:这种情况很常见,公共牌就是NUTS. 如果第1个玩家push了,第2个玩家不能call, 因为call 的话要花费24.50,但是抽水就是2.5 .所以call的玩家只能拿回23.75. 损失0.75 。 所以这种情况的GTO策略是  第1个做动作的玩家push,得到0.95,第2个做动作的玩家应该fold..  不然就都损失0.75....想下你平时这种情况,你先动作的时候是不是check了?后动作的时候速度call了?+ F/ p0 I5 p& H2 N9 ^, X- a. r. C
) Q7 L8 n  \; K" T
        上面2个例子是比较简单的GTO.下次我会从cash的2人单挑开始讲pre-flop,flop,turn,river等各个阶段的GTO策略和原理。& r9 s* C) p- H7 Q+ k
$ Z; ^. Q- N& {1 F: E4 v
        =======================技术哥答疑板块: ==========================
0 K- _9 u2 W, i& v( x/ H
# w; b4 z5 h% d6 @8 R) _) d1 ~1 |7 V5 r        有人经常在问。如何算碾压了了一个级别,多少手的样本能够说明我站稳了?
4 X, T5 O8 z" ^+ G" z
: ~9 G3 U3 @. K+ h7 z        我来回答大家最关心的一个问题:cash和sng中 多少样本量能说明是否站稳这个级别。足够多的量是多少量呢? 5 B. q' H$ l1 z! i

8 [$ `: r8 W' M        公式: Long Run = 4*(SD/W)^2*period         (w是 赢率 w/period,一般是5bb/100  ,period = 100,w = 5) ( m! z: q# c2 P$ d% \: z1 W! Q
; y, y7 {- j2 }5 `3 p
                                                  (SD是standard deviation, 和期望有关,无限9人满员桌,标准的SD大约85bb/100,6人桌标准的SD大约95bb/100)
- t  A1 B6 z7 f8 f7 E% x, m
3 b2 X  T% ~9 k, `# e8 Y5 d        例如:在cash中,你当前的赢率是 8bb/100,SD是90bb/100 , 那么 Long Run = (4)[(90/8)^2]*100 hands = 50625 hands8 U6 l  s1 o# ?6 C5 f$ K

9 E' j. l3 Y8 Y+ n/ E1 Q        就是说 50625手牌就是足够的样本量。证明你的确有8bb/100
' @: V# T+ q* o0 H
* Y4 Y) C4 h5 `4 Y' x- z  f# I        在 sng中,SD 和 奖励结构有关,还有ROI和买入大小也影响。这里直接说结论。8 f; U  i5 d+ u1 W
, I2 K5 Z2 V' e/ d& T
                                   假设你是平均每场买入1.55的SNG6 m9 z2 ]* j% d% n2 T) ^
                                   ROI                      Long Run; R) T. F5 M1 |$ Z
                                   15%                     427 场9 X9 t7 K) o3 R9 i2 }) l6 f
                                   10%                     961 1 b, R. K! t+ W
                                   7%                       1961
3 [* I5 i( O6 v5 H. I' A/ |                                   5%                       38449 ]  Y. W( \) K1 r+ ]9 v
                                   3%                       10678
5 s4 `) p* N! q' Z3 [                                   1%                       96100
& w/ {) O9 h1 v                                   -2%                      24025# H; ?& w' B/ n+ I5 Z, a- A1 c% u
                                   -35%                    78" O" A. P, A, {" @& r

1 z/ w* L% P7 }: w" L% ?        可以看到,Roi 越接近 0,需要的样本量越多,该结果不包括反水,比如你5%的roi,加2%的反水,就可以看7%了。 最苦的是1% roi的玩家。。。可能需要10万场才能知道自己是否能站稳当前级别。& r: r! W- \- J: `7 K7 r" Z7 v
2 C) l0 t. i/ l( F: I

# R5 |! W' a4 m* {0 v
作者: sayanara    时间: 2015-4-17 23:10
楼主在哪里转来的帖子啊?
作者: 专杀庄家    时间: 2015-5-1 20:10
很有必要来了解这个啊
作者: benlau0214    时间: 2015-5-6 13:37
好像很难懂的样子,怎么才能学会的哦




欢迎光临 优惠论坛 (http://tcelue.ooo/) Powered by Discuz! X3.1