石头设计网

当前位置:主页首页 > 英语学习 > 英语写作 > 背景文化 > >

余小鲁:围棋彩票在人工智能背景下的发展研究

来源::网络整理 | 作者:管理员 | 本文已影响

  摘要受最近韩国“重启围棋彩票案”的启发,本文重点研究围棋彩票赔率的设置,从庄家和玩家两方面来讨论围棋彩票的科学基础。并以实际对弈平台的具体例子,来建立模型展开量化的研究,为进一步用大数据人工智能机器学习打下基础。最后展望了我国未来围棋彩票业的可能发展。

  一、研究背景

  Alpha Go的出现,对围棋在某个局面下,黑白双方的胜率有了极为精准的判断,这是在人工智能发展史上一个划时代的成就。但对于将要进行的某场围棋比赛,双方胜率的预测,Alpha Go却无能为力。本研究基于职业围棋大数据和全历史排名算法(Whole HistoryRating,下文简称WHR),利用人工智能机器学习的方法论,对围棋比赛双方的胜率做出科学的预测。

  人工智能的高速发展,在博彩业的各个方面都有了精准的预测和赔率。近年来,随着围棋比赛的高度商业化市场化,对于围棋比赛结果的科学预测,将会有广泛的市场意义,并将进一步推动围棋的大众化。国家体育总局发行的体育彩票,以足彩为例,也是基于对足球比赛结果的科学预测。同样的道理,围棋作为一个历史悠久的体育项目,如果能对比赛结果有科学的预测,能够为广大围棋爱好者提供合理的赔率,围棋彩票在未来将成为可能。如在今年的7月19日,韩国的曹薰铉议员出席棋士会为“重启围棋彩票案”。会议的议案有两则,一为“是否重新启动围棋体育彩票事业”,一为“是否把伦理委员会更名为赏罚委员会”。经四个小时的会议,“重启围棋彩票案”101人投赞成票、59人投反对票,议案获得通过。“伦理委员会更名案”90人投赞成票、67人投反对票,议案亦获得通过。对于这个“重启围棋彩票案”议案,韩国职业棋界毁誉参半,赞成的说“考虑到周边棋士们平素的氛围,议案获得通过是早已预见到的结果。现在围棋界连棋战都维持不下来,所以需要’彩票’的胜负手。”反对的说“氛围上大致预想到赞成票会更多一些,但没想到赞反的票数差距会这么大。我怀疑韩国棋院执行部能否有效杜绝围棋彩票带来的副作用?同时我也希望今天投赞成票的棋手们苦心思考这个问题。”

  本文不考虑现实制度问题,先从学术层面上研究,影响一场围棋比赛结果的场内场外因素非常之多,有诸多偶然性和随机性。对围棋比赛结果的科学预测,将会是人工智能机器学习的一大挑战和新的机遇。

  二、方法论

  对于围棋比赛结果预测,人工智能机器学习采用的范式为监督学习。每场围棋比赛都只有两个结果(没有平局,三劫循环无胜负的情况极少)。监督学习就是让计算机在围棋比赛历史数据中找出科学的规律,其中最关键的就是要提取出影响围棋比赛的主要因素,称为特征。从特征到历史数据中有标记的结果(谁胜谁负)存在着一种多元复杂的函数关系。监督学习的方法,就是要有效的近似这个未知函数,才能对未来的比赛作出合理的预测。

  影响一场围棋比赛结果最重要的特征当然是围棋选手自身的实力。那么围棋选手自身的实力该如何量化的体现呢?古老的段位制度是一种粗糙的量化方法,已经完全不能满足现代围棋比赛预测的需要。WHR的方法,考虑了所有选手之间的对战成绩,对选手的实力采取动力学更新的Bradley-Terry模型再加上贝叶斯概率推断的修正,非常有效的概括了围棋选手的实力。那么我们研究思路选取的特征第一个就是比赛双方的WHR分数。再结合以下六个特征:1。双方年龄。2。比赛用时(快棋/慢棋)。3。比赛奖金。4。选手性别(男/女)。5。最近12个月双方交手的历史战绩。6。主客场。

  从特征到结果的对应,我们将训练神经网络分类器(二元分类)。把围棋比赛历史数据随机拆分成为以下三块:1。训练集(占60%)。2。 交叉验证集(占20%)。3。预测集(占20%)。 最后算法预测的准确率,由其在预测集中的表现来判断。

  训练完成之后,对于将进行的每一场围棋比赛,只要输入双方的WHR分数,和上面所述的六个特征参数,即可以输出机器学习所得到的预测结果及其对应的概率。更进一步的,可以把以上机器学习的过程整合成为一个界面友好的APP,方便展示和广大棋友的使用。

  在全面开展人工智能研究之前,为了更好理解围棋比赛的预测押注策略,我们下一章先以弈城押分为例,建立一个预测的玩具模型(toymodel)。在此必须强调的是,这个玩具模型用的是第一性原理的方法。第一性原理对待围棋,就是从围棋的胜负规则和死活规则开始研究围棋,不是从布局理论定式来开始研究。布局理论定式这些威力非常的大,但不是第一性的,是从围棋的胜负规则和死活规则自然演绎出来的。围棋的第一性原理,就是气尽棋亡。直接的推论,就是气要不会尽,大多时候需要有两个眼。然后就开始研究如何容易有两个眼,如何围空效率高。中国古人的围棋理论非常高明,清代施襄夏的总决开篇第一句,起手据边隅,逸己攻人原在是。这个理论要解释围棋布局起手为什么是下在边角上,是因为自己容易活(逸),容易活的地方被你占了对手就不容易活,叫“逸己攻人”,过了三百年,现在巅峰造极的阿尔法围棋,依然是起手据边隅,这就是理论思考的力量。接下来第二句叫入腹争正面,制孤克敌验于斯。必须注意,这就不是第一性原理的直接推论了,所以开始模糊,理论开始变得“危险”。因为人为定义了一个概念叫“正面”,进入围棋中腹的正面究竟是哪一面?但这个理论依然威力非常强大,顶尖高手心中都有正逆向背的概念。但入腹争正面只能称之为一个假设,也许是一个非常好的假设。下面一章就是只用了一个假设,初步的研究围棋彩票。

  三、玩具模型——以弈城围棋押分为例

  对棋赛的预测,整体上说有两大流派。

  第一是基础分析,就是用种种参数来刻画棋手的真正实力。比如说,棋手的等级分就是一个重要的参数。等级分高的棋手占优势,这是一个统计判断。机器怎么看棋谱,其实也是一个大问题。我们可以直接对棋盘拍个照片,发给机器,让它去看去图像识别,但这样信息量太大。因此我们回过头来思考,人是怎么样看围棋的某个局面的?我们创造了一些概念,看谁厚谁薄,看谁空多谁空少,看谁有孤棋的负担等等。但适合人的概念未必适合机器。机器需要可以量化的特征。举个例子,阿法围棋看棋谱,一个重要的特征就是气。棋盘上每一块棋每一时刻的气,都要当成一个特征输入参数。机器看一张棋谱,看到的就是类似于气这样一个个的数值参数。人脑对于概率性的判断有很大的缺陷,从进化论的角度讲,从原始人进化到现在,并不需要我们学会区分75%和80%的事件,所以我们大脑一直没有进化出来这部分的能力,机器学习在这方面的优势是压倒性的。让机器集中分析棋赛的基本面,认为这个基本面可以对应到真正的胜负概率,也就是赔率真实价位。对照庄家开出来的赔率,从而找出被低估的价格。


分享到: 更多

更多关于“背景文化”的文章

随机阅读TODAY'S FOCUS