世界杯买大小球怎么算(AI教你世界杯怎么买(含预测))
更新时间:2022-11-10 03:33:03小赌怡情,大赌伤身,佛系看球!
写在前面
四年一度的世界杯又来了,作为没什么时间看球的码农,跟大家一样,靠买买给自己点看球动力和乐趣,然而总是买错球队,面对各种赔率也不知道怎么买才划算,是不是碰大运的?如何提高自己的预测水平,成为预言帝,升职加薪迎娶白富美走上人生巅峰?
本文采用机器学习方法,试图通过特定指标进行训练,对世界杯剩下的比赛胜负平做预测,并判断给出的赔率是否值得买,以赢得博弈游戏的胜利。选取的数据量较少,仅提供一种思路。
以下为我的程序 6.28 日的预测结果(第二列为主队获胜概率,0~1):
7 月 2 日以后预测(不断更新中):
本文主要写给跟我一样对机器学习的实际应用感兴趣的,但没有入门的小白程序员。初步尝试,抛砖引玉,如有大牛看出计算方法和数据的问题,欢迎指点讨论。字数较多,详细研究推荐在 web 端观看。
本文基于以下假设:
作为简化,不考虑几场组合串、让球胜平负、大小球、比分、进球数之类的场景。只考虑胜平负情况及赔率因素。本文不讨论庄家如何通过调整赔率和双方下注额获利,只讨论下注用户如何盈利。
机器学习的一般步骤: 定义问题、数据预处理、特征工程、机器学习建模及训练、模型应用。为了定义问题,说清楚为什么要解决这个问题,我们首先需要先学习些基本概率赔率知识。
概率赔率基本知识
我们用初中数学知识来学习 EV 知识,并绕过两个常见的赌场陷阱。
赔率陷阱
我们先来看一个抛硬币的场景,假设正反面出现概率就是 50%,你每次需要投入 1 元,你赢了给你 1.8 元( 即赔率 1.8 ),输了就没有,这个游戏你应该玩吗?
这就要引入 EV(期望值)公式了:
EV = 盈利×获胜率 - 损失×失败率 ,EV 是每回合游戏你的平均盈利 / 亏损值。EV 为正,长期来看你是盈利的,EV 为负,长期看亏损。
具体到这个例子 就是 EV = (1.8-1)×0.5 - 1×0.5 = - 0.1 , 平均来说,你每轮会亏损 0.1 元,所以你不应该玩这个。 更直观点,你玩了两轮,第一轮赢,得到 0.8 元,第二轮输,失去 1 元,所以两轮是 -0.2 元,平均就是 -0.1 元 / 轮。
赌场会有各种赔率陷阱,套用这个公式大体上都能识别出来,赌场就是靠这些赔率陷阱有了微弱的优势来盈利的,例如赌场优势是 1.2%,21 点赌场优势最小(0.58%),长期来看都是负 EV。即使真有正 EV 的游戏,也会因为赌场庞大的资金量和你不对等的小资金量导致你在某次小概率事件里破产,所以理性看待,这里只做数学分析。
赌徒谬误陷阱
赌徒谬误大意是指将前后相互独立的随机事件当成有关联的事件,例如抛硬币时,无论抛几次,任意两次之间都是相互独立的,并不相互产生影响。道理虽简单易懂,但有时仍会糊涂。比如,当你连抛了 5 次正面时,到了第 6 次,你可能会认为这次正面出现的概率会更小了( 1/2),反面出现的概率会更大( 1/2)。
赌场中著名的输后加倍下注系统(Martingale)便是利用此心态的实例:赌徒第一次下注 1 元,如输了则下注 2 元,再输则变成 4 元,如此类推,直到赢出为止。赌徒误以为在连续输了多次之后,胜出的概率会变大,所以愿意加倍又加倍地下注,殊不知其实概率是不变的,赌场的游戏机没有记忆,不会因为你输了就给你更多胜出的机会。
这时候就要用到上文的 EV 公式,某次的成功并不改变后果,你的期望值没有变,怎么做这种倍数努力都是没用的。 而且下注都有上限,如果你的资金无穷大且允许你下注无穷大,那么加倍下注确实能赢。可惜现实里做不到,小概率事件会把你弄的倾家荡产 TT。
反等价鞅法则、凯利公式感兴趣的可以研究下,这里不再展开。我们只要知道正 EV 情况下我们才应该买就好。
赔率及返还率推导
买如何获利的呢?
根据之前的赔率知识,当计算出我们获胜的胜率,再结合给出的赔率,我们认为获胜时候 EV 为正,那么就可以下注。而不是说看赔率高就无脑以小博大,那样还是在。
的赔率又是怎么计算出来的呢?其实是根据胜率和返还率倒推的。
首先需要了解返还率这个指标 。一场比赛 假设 W、D、L 各代表主胜、平赔、客胜的赔率,P 为主胜的概率, 假设我们投入 1 元,在 0EV 状况下有:
(W-1) × 1 × P - 1× (1-P) = 0
W-1 为盈利, 1 为输的时候的亏损。那么 求解方程 P = 1/W , 同理 平的概率是 1/D , 客胜的概率是 1/L ,加起来是 100%。
在没有干预的情况下: 返还金额 / 金额 = 1 /(1/W 1/D 1/L ) = 100%可是或者公司是要盈利的,那么他们就会从总资金里抽取一部分, 于是返还金额就金额。 于是就有 1/W×返还率 1/D×返还率 1/L×返还率 = 1 ,
例如胜场,赌场估计的概率就是 1/W×返还率 。 返还率 也可以用1 /(1/W 1/D 1/L ) = 1/ ( (W×D W×L D×L) / (W×D×L)) = (W×D×L) / (W×D W×L D×L) 计算,更方便。
于是你看到开出的胜平负赔率 ,就可以算出胜平负的概率和的返还率了 。例如胜 2.34 平 3.05 负 2.80,返还率为 (W×D×L) / (W×D W×L D×L) = 90% 公司对该项比赛的概率估计为主队胜 0.9/2.34 =0.384=38.4% 。 实际预算的时候是先有胜负概率再出赔率的,公司根据各种因素指标,计算出了主队胜率, 然后主队的赔率就有了: W = 返还率 / 胜率 。 平和负的计算方法也是类似。
我们如何获胜呢?只能假设公司概率估低,给出的赔率高了,这样套用 EV 公式 EV = (2.34-1) ×P - (1-P) 0 , 即 P 1/W= 42.735% , 即 告诉我们他们计算主场胜率是 38.4%,而我们认为主队胜率大于 42.735% 时候就可以下注了 ,这时我们有微弱的优势,而且自行分析概率后就不容易被误导 ^^ 大家可以自行推倒二串一、三串一这种是否划算,不过早期比如提前几天的时候因为局势不明,是有可能有比较高的赔率。
定义问题,特征选取,数据抓取
绕了一大圈,其实简单来说,我们要做的就是自行计算胜平负的概率,然后套用 EV 公式看根据赔率是否划算。
这个问题抽象下,是一个预测类的问题。如果想要预测目标变量的值,可以选择监督学习算法,否则可以选择无监督算法。所以这个问题可以归类认为是机器学习的监督学习,可以用线性回归去解决这类问题。
简单地讲,浏览一些数据网站,我们可以选定一些特征和历史比赛结果样本,作为多元一次方程组去求解, 即 aX bY cZ = R 。 我们要做的就是求解参数 a、b、c。这种方法在机器学习里就叫做多变量线性回归,有通用的解法。(PS:如果当年早知道,就可以顺利解决 AppStore 排名预测问题了)
特征选取:
根据某数据网站数据,这里选择主队获胜赔率、主队平局赔率、主队负赔率、主队世界排名、客队世界排名、主队近期胜率、客队近期胜率、主队信心指数、让球指数、让球后主胜赔率、让球后主平赔率、让球后主负赔率作为特征,结果集为最终胜平负赛果 ,简单起见,定为主胜 值为 1(含平局)、主负值为 0 处理。
使用 python3 BeautifulSoup 写爬虫抓数据,代码详见 :
github github/sgp2004/world_cup_AI
模型建立,程序回测,预测胜率
28 日晚 22 点前总共 44 场比赛,我们使用 Logistic 回归 Sigmoid 函数分类方式处理(详情请阅读参考文献《机器学习实战》),训练算法为改进的随机梯度上升算法:
选择训练集和测试集都为这 44 场比赛,这时的错误率为 28%,观察干扰数据:
这就是足球的迷人地方,error 包含了韩国对德国这个超大冷门,我们的程序预测韩国胜率几乎为 0。
用这个模型预测 28 日及以后的 8 场比赛, 步长改为更小,到时看看是否能达到 72% 的胜率:
时间场次, 主队胜率 日 本 VS 波 兰,0 塞内加 VS 哥伦比,0 英格兰 VS 比利时,0.95 巴拿马 VS 突尼斯,0.001 法 国 VS 阿根廷,0 乌拉圭 VS 葡萄牙,0.869032 俄罗斯 VS 西班牙,0.001 克罗地 VS 丹 麦,0.77
7.2 日预测之后 5 场比赛:
巴 西 VS 墨西哥,0.994871 比利时 VS 日 本,0.998338 瑞 典 VS 瑞士, 0.003197 哥伦比 VS 英格兰,0.000737 乌拉圭 VS 法 国,0.820381
结论及展望
综上,我们看球预测时,需要较精确地估算出一个胜率,然后看给的赔率是否合适,如果胜率 1/ 赔率,则适合下注,是个正 EV 的游戏,而不是十分肯定地说某某队会赢,毕竟庄家都不敢这么预测。如何估算胜率?我们可以选择一些特征值,进行线性回归,确定特征值对应的系数,然后预测下场比赛的赛果。
本文模型选的特征值比较少,只依赖数据网站,缺少很多信息,准确率不高,回归系数没有完全收敛,也不能评估出胜负外的概率,需要调整参数。本人会继续改进。
参考文献
赌徒谬误:
zhuanlan.zhihu/p/26929562
《机器学习实战》
别赌球了,你只是“庄家必赢公式”的玩偶
mp.weixin.qq/s/ig06FpzhqE_9dFOtziCxKA
爆冷让人心慌?如何让「下注」稳赚不赔?
mp.weixin.qq/s/baftxbdQQKTP-SEutM4uhw
作者介绍
沈冠璞,熊猫直播技术经理。专注服务端技术,关注机器学习。
相关推荐
-
2o18足球世界杯实况(《实况足球》——一首写给世界杯的情书(1998))
查看详情
-
世界杯预选赛直播男篮中国对巴(世界杯又来了!国足今晚首战马尔代夫)
查看详情
-
2夺欧洲杯4获世界杯(俱乐部的成就引领国家队的辉煌——世界杯巡礼之西班牙篇)
查看详情
-
世界杯8分之一比赛比分(世界杯小历史,1990世界杯1/8决赛,艰难的胜利,普拉特漂亮一击)
查看详情
-
篮球世界杯中国最多几强(支持杜峰下课,但是中国男篮从世界第八沦为亚洲第八这个锅不该背)
查看详情
-
葡萄牙vs乌拉圭首发(出战世界杯稳了!孙准浩替补踢半场长传成功率高 一优势有望获重用)
查看详情
-
中国男足VS沙特男足动漫图片(这部足球动画让日本队踢进了世界杯)
查看详情
-
世界杯进球最多的赛事(历届世界杯决赛里面11大进球最多的比赛)
查看详情
- 最新资讯
-
- 2022-11-15 世界杯8分之一比赛比分(世界杯小历史,1990世界杯1/8决赛,艰难的胜利,普拉特漂亮一击)
- 2022-11-15 12年奥运会金牌哪个国家最多(世运会最终奖牌榜:中国第十,乌克兰第三,德国力压美国排名榜首)
- 2022-11-15 我对穆帅有种特殊的感情(纵你虐我千百遍,我仍待你如初恋!穆里尼奥:希望曼联早日复兴)
- 2022-11-15 菲律宾韩国街在哪里(韩国 | 九月初的济州岛,时有风,偶有雨)
- 2022-11-15 欧联杯冠军进欧冠什么时候(欧冠赛与欧联杯的区别,你知道多少?)
- 2022-11-15 为什么nba篮球员妻子都爱(为何科比的妻子那么受欢迎呢,十几个人追求?拥有三个魅力原因)
- 2022-11-15 5号篮球和7号篮球图(2022-2023赛季NBA每支球队的城市版球衣)
- 2022-11-15 花式运球有错吗(指责队友犯规,自己花式运球失误?郭艾伦的脾气决定辽篮上限)
- 2022-11-15 我想看霹雳赛车(嘲讽值拉满,魏国黑科技霹雳车,守九宫八卦能打赢满红吴骑)
- 2022-11-15 马内造红牌 破门(马内遭“爆头”仍坚持比赛15分钟并进球,球迷痛批塞内加尔换人不及时)
- 推荐攻略
-
-
乌克兰总统身亡(乌总统泽连斯基解除乌总检察长及国家安全局局长职务)
-
足球比赛每个半场多少分钟(足球比赛每半场几分钟)
-
2021中超今天哪里转播(今晚!中超2场对决,CCTV5 直播申花PK武汉,腾讯体育亚泰vs天津)
-
2022梅西坠机身亡事件结果(足坛变天!巴萨无缘榜首的2年:梅西告别,老马去世,2-8惨案)
-
2021全运会篮球直播赛程辽宁(4月22日央视直播:CBA总决赛;赵心童vs马奎尔,塞尔比vs颜丙涛)
-
中国最强导弹(世界洲际导弹前10排名,中国东风导弹领先美国,第一名堪称导弹王)
-
2021篮球比赛在哪里看(CCTV5直播NBA 辽篮争夺CBA总决赛冠军点 颜丙涛出战斯诺克世锦赛)
-
东航结果不敢公布了(民航局再次回应东航MU5735事故调查!查明原因有多难,多久公布?)
-