本篇文章2061字,读完约5分钟

我知道谷歌会分享,但我不知道它会这么快。

虽然只有1/4的孩子,阿尔法戈昨天在对阵科杰的比赛中表现出色,其稳健的风格已经显示出其强大的实力。

deepmind创始人兼首席执行官戴密斯·哈萨比斯(左)和首席科学家大卫·西尔弗(右)

今天上午,围棋峰会的另一个亮点——中国乌镇人工智能峰会论坛正式启动。雷锋。通讯器也第一次来到现场。台上第一个发言的人不是别人,正是创造了Go人工智能alphago的两位关键人物:deepmind的创始人兼首席执行官戴密斯·哈萨比斯和deepmind的首席科学家大卫·西尔弗。

在简短的演讲中,哈萨比斯和西尔弗全面解释了alphago能够取得目前成果的原因,并收集了go人的大量评论。但最意想不到的是最新版本的阿尔法go的信息披露。

阿尔法围棋大师:世界上最强大的电脑围棋手

此前,人们一直在猜测阿尔法戈是什么版本,今年年初,阿尔法戈在野生狐狸平台上横扫了60名职业玩家。

在大卫·西尔弗展示的ppt中,明确提到了阿尔法戈的三个头衔:阿尔法戈范(对抗范辉的版本)、阿尔法戈李(对抗李师义的版本)和阿尔法戈大师(驾驶大师的版本)。与流行版本的v18/v20相比,这三个名字很容易理解。

他们之间最重要的区别是象棋的水平。谷歌还在三项指标中显示了Go的elo分数:

2015年10月,阿尔法戈粉丝得分约为2,900分,2016年3月,阿尔法戈李得分约为3,700分(李石图本人目前得分为3,530分)。今年年初,阿尔法戈大师获得了大约4800分。

考虑到世界第一人柯杰的评分低于3625分,谷歌还给出了阿尔法戈李和阿尔法戈大师三个孩子的参考数字。

柯杰本人在现场目睹这一差距后,忍不住在微博上表达了自己的感受:

我听说过新阿尔法战士的力量...但是...让...让三个?天啊,这差距有多大?一个简单的解释是,一个人轮流玩围棋,对手让你连续走下三步...就像武术专家让你先捅三刀一样...我在和哪个可怕的对手下棋?...

值得注意的是,评分的值实际上是由一系列比赛的结果决定的,当赢家和输家都存在时(高和低都有参考值),这个值更准确。然而,阿尔法围棋大师在面对职业围棋手之前,已经连续赢了60盘,成绩可能与实际水平相差甚远(没有封顶)。

雷锋。(公开号码:雷锋。com)还引用了《三联生活周刊》科技记者昨天在朋友圈中的相关观点,即如果你想知道最新版本的alphago超过人类多少,这可能是唯一的证明方法。

当然,这三者在配置和运行模式上有很大的不同。以下是根据现场布置的简单表格。

看到这一幕,有人会惊呼:从50 tpu到1 TPU,谷歌是在逆天吗?这个想法实际上是错误的。

原因是阿尔法戈大师实际上站在一个巨人(阿尔法戈李)的肩膀上。

为什么阿尔法戈大师的力量与阿尔法戈·李关系密切?

事实上,阿尔法戈范和阿尔法戈李可以分为同一时期,如果他们必须分为阶段。

两者具有相同的整体算法架构:“深度学习+蒙特卡罗搜索树+强化学习”。或者你可以把它们理解为初中生和高中生的区别。范辉的版本在数据积累和算法细节规则方面还没有达到极致,而后者要完美得多。

当我们到达alphago lee时,“go人工智能障碍”已经解决了,我们最初认为它有太多的可能性,无法彻底找到最佳解决方案。

巨大的蒙特卡洛搜索树

简而言之,谷歌实际上发现了两种“懒惰”的方法:首先,它只指在进行下一次计算时,人类通过深入学习获得的选项。(如果人类不下去,就不算数)

第二是估值网络。当每一步都失败时,也不可能直接计算结果。因为随着预测步骤的增加,蒙特卡罗搜索树中要计算的内容将呈指数增长。所以阿尔法戈引入了一个计分系统。没有一个地方是100%赢的,但是这个地方比其他地方好。

经过这两个步骤的纵向和横向精简,阿尔法戈完成了一项几乎不可能完成的任务——在去年三月的比赛中击败了李师义。

然而,除了最终结果之外,阿尔法戈在那场比赛中的几场表现也值得关注:经常有一些棋步被人认为是有问题的;在第四场比赛中,当李师义是众神之一时,他的估价网络像悬崖一样起伏不定。

这无疑反映了阿尔法戈李自身的不成熟。

那么我们怎样才能把它提升到下一个层次呢?与之前“完全抛弃阿尔法戈的人性因素”的猜测不同,谷歌采取了一种更安全的途径——建立一个全新的神经网络,在阿尔法戈·李的基础上进行二次“学习”,并不断记录所学内容。

这也使得阿尔法戈大师比阿尔法戈·李更加严谨和稳定。这就是为什么阿尔法戈昨天在三钱国际象棋的第一局结束时并不害怕柯杰的追击,只采取了最稳定的策略。当然,其他问题仍然存在,比如阿尔法狼大师如何依靠一个tpu完成整个游戏?阿尔法戈大师在比赛中需要阿尔法戈·李的帮助吗?

另一方面,谷歌最终并没有选择“抛弃”人类,这最终表明人类2600年的历史并非没有沉淀。这可能是一个罕见的小解脱。

关于阿尔法围棋对柯杰的下一场比赛以及围棋峰会的更多内容,雷锋。com将继续带给你第一手的报道,所以请注意。

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

来源:搜狐微门户

标题:揭秘新版AlphaGo,为什么它能战胜柯洁?

地址:http://www.shwmhw.com/shxw/62146.html