版权归原作者所有,如有侵权,请联系我们

[科普中国]-OpenGo

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

OpenGo是Facebook AI Research团队(FAIR)所开发的计算机围棋软件。

简介

ELF OpenGo是FacebookAI Research团队(FAIR)依照DeepMind在科学期刊《自然》上对于AlphaGo Zero所发表的论文《Mastering the game of Go without human knowledge》与AlphaZero的论文《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm》所实做出的开源计算机围棋程序,也就是不使用人类棋谱与累积的围棋知识,仅实做围棋规则,使用单一类神经网络从自我对弈中学习(不像AlphaGo以人类角度思考,设计了Policy Network与Value Network)。

训练网络使用20 blocks x 224 filters,在2000个GPU下训练两周,相较AlphaGo Zero使用的20 blocks x 256 filters版本略小一些(AlphaGo Zero另外还有40 blocks x 256 filters)。

由于Facebook所拥有的计算资源,产生出高品质的训练网络数据与对局棋谱,许多基于相同算法或是AlphaGo相关论文内容的围棋软件都积极测试ELF OpenGo所提供的训练数据。

成绩对计算机

Leela Zero是少数有公开代码并公开训练网络数据的围棋软件,且仍然有志愿者持续投入资源计算演化,故经常被当作其他围棋软件的基准。由Facebook自行测试,ELF OpenGo与Leela Zero对战的成绩为198:2。

CGOS

志愿者在CGOS上使用Leela Zero的程序引擎以及由ELF OpenGo公开的训练网络转换成Leela Zero格式的训练网络(即Hash值62b5417b的训练网络,账号LZ_62b541_ELF_1600)进行对弈测试,但由于在CGOS上测试的不是ELF Go的程序引擎,不清楚ELF OpenGo的训练数据在转换后的影响。另外因CGOS上没有较强的围棋软件参与对弈,需要较长盘数比较才能看出实际实力的落点1。

截至2018年5月30日,对弈已经超过1000盘,BayesElo分数约3770分。

对人

Facebook与韩国棋院合作,以中国规则与韩国的世界顶尖棋手对弈(贴目7.5目),在计算机每步限制50秒(使用单机单张NVIDIA Tesla V100),人类不限时间的前提下,每个人至少下两局,达到14:0的成绩,对弈对手包括金志锡、申真谞、朴永训以及崔哲瀚。

相关链接

AlphaGo Zero,所引用论文的计算机围棋软件。

Darkforest,上一代Facebook所开发的计算机围棋软件。

Leela Zero,另外一套也是依照AlphaGo Zero所实做的开源计算机围棋软件,在ELF OpenGo测试时被当作比较基准。

计算机围棋

围棋软件

本词条内容贡献者为:

王慧维 - 副研究员 - 西南大学