OpenGo是Facebook AI Research团队(FAIR)所开发的计算机围棋软件。
简介ELF OpenGo是FacebookAI Research团队(FAIR)依照DeepMind在科学期刊《自然》上对于AlphaGo Zero所发表的论文《Mastering the game of Go without human knowledge》与AlphaZero的论文《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm》所实做出的开源计算机围棋程序,也就是不使用人类棋谱与累积的围棋知识,仅实做围棋规则,使用单一类神经网络从自我对弈中学习(不像AlphaGo以人类角度思考,设计了Policy Network与Value Network)。
训练网络使用20 blocks x 224 filters,在2000个GPU下训练两周,相较AlphaGo Zero使用的20 blocks x 256 filters版本略小一些(AlphaGo Zero另外还有40 blocks x 256 filters)。
由于Facebook所拥有的计算资源,产生出高品质的训练网络数据与对局棋谱,许多基于相同算法或是AlphaGo相关论文内容的围棋软件都积极测试ELF OpenGo所提供的训练数据。
成绩对计算机Leela Zero是少数有公开代码并公开训练网络数据的围棋软件,且仍然有志愿者持续投入资源计算演化,故经常被当作其他围棋软件的基准。由Facebook自行测试,ELF OpenGo与Leela Zero对战的成绩为198:2。
CGOS
志愿者在CGOS上使用Leela Zero的程序引擎以及由ELF OpenGo公开的训练网络转换成Leela Zero格式的训练网络(即Hash值62b5417b的训练网络,账号LZ_62b541_ELF_1600)进行对弈测试,但由于在CGOS上测试的不是ELF Go的程序引擎,不清楚ELF OpenGo的训练数据在转换后的影响。另外因CGOS上没有较强的围棋软件参与对弈,需要较长盘数比较才能看出实际实力的落点1。
截至2018年5月30日,对弈已经超过1000盘,BayesElo分数约3770分。
对人Facebook与韩国棋院合作,以中国规则与韩国的世界顶尖棋手对弈(贴目7.5目),在计算机每步限制50秒(使用单机单张NVIDIA Tesla V100),人类不限时间的前提下,每个人至少下两局,达到14:0的成绩,对弈对手包括金志锡、申真谞、朴永训以及崔哲瀚。
相关链接AlphaGo Zero,所引用论文的计算机围棋软件。
Darkforest,上一代Facebook所开发的计算机围棋软件。
Leela Zero,另外一套也是依照AlphaGo Zero所实做的开源计算机围棋软件,在ELF OpenGo测试时被当作比较基准。
计算机围棋
围棋软件
本词条内容贡献者为:
王慧维 - 副研究员 - 西南大学

扫码下载APP
科普中国APP
科普中国
科普中国