本篇文章2099字,读完约5分钟
雷锋。乌镇围棋峰会的第一场比赛已经结束,持续了四个半小时。最后柯杰的九个区输给了阿尔法戈,阿尔法戈赢了四分之一。这种平静的结果一定是许多人预料到的。然而,每个人从一开始就知道,关注的焦点不是柯杰是如何消失的,而是阿尔法戈进化到了什么程度。深度思维团队还需要一段时间才能发表论文来解释阿尔法戈有多强大。
第一局棋速进行到一半的时候,象棋组的很多人都沸腾了,发现阿尔法围棋的速度非常快,每局的速度在30秒到40秒之间波动。为此,围棋业余五段的赵老师对雷锋进行了点评。(公开号码:雷锋。人工智能技术说:“(这个游戏就像安乐死,它在不知不觉中就消失了。(与去年相比)机器速度很快,但基本上没有错误。”
总的来说,阿尔法戈冷静果断,而柯杰的情况发生了很大变化。最后,在比赛持续了四个多小时后,阿尔法戈赢得了四分之一。
当象棋风格alphago1.0(去年3月与李世石对弈)时,其象棋风格被概括为擅长记棋谱+增强学习+计算能力,你也可以看到人类象棋风格的影子。当阿尔法围棋伪装成大师60连胜时,许多围棋大师,包括聂卫平,开始评价他们的棋风。“很难猜出主人的风格...它永远不会有表情,永远不会受情绪的影响,永远有节奏,也就是说,今天,在第一局棋赛结束之前,搜狗的王小川在智湖上发表了一份文件,分析说阿尔法狼2.0的棋风完全脱离了人类的经验——“虽然阿尔法狼2.0脱离了机器对人的模仿,但象棋的风格也将完全脱离人类的公式。在与柯杰的比赛中,我们会有意想不到的动作,这些动作会被认为是低级错误或在教科书中完全不合理。然而,一个普通的棋手不会这样玩,但是一个新手会被指示这样玩。阿尔法狼2.0将继续制造这样的局面,他仍然是对的。”
然而,最终,柯杰说了算。在会后的采访中,他用了一个很好的例子来说明阿尔法戈的棋风是不可预测的:(当他回顾这场比赛的时候,他也破了第54手),他表达了自己的肯定:“震惊,这在人类的游戏中是找不到的。休息过后,它把自己的脚步变得更粗,一举两得。”。
alphago1.0(去年3月与李世石对弈时)中使用的算法精华,根据田元东自然篇的解读,估值网络对棋类游戏进行评估,策略网络选择玩家,快速部署适当加速。然后,使用蒙特卡罗树搜索将上述三个部分连接起来,形成一个完整的系统。
这一次,虽然智湖论坛和其他活跃的网站已经开始猜测阿尔法狼2.0这次使用了什么伟大的算法,但由于硬件预测错误,真相将在深入人心后亲自公布。视觉算法应该根据它的10个处理器+TPU的独立版本来预测这一点。
硬件要求降低
根据deepmind员工在2016年1月的《自然》杂志上发表的论文,分布式版本(alphago distributed)使用了1202个处理器和176个图形处理器。
然而,deepmind在会后的新闻发布会上表示,本次比赛中的alphago是一个新版本,它改进了新算法。主要的进步是计算量减少了十倍,自我发挥更强。哈萨比斯说,该程序在竞赛中运行在一台机器上,这与去年发布时不同。这一次,有了更强大的算法,它们操作起来更简单、更好,速度也更快。此外,哈萨比斯说,计算能力可以“在谷歌云中获得,使用tpu,十个处理单元,计算能力减少十倍。”简而言之,这个alphago是一个独立的版本。
在剑桥大学的一次讲座中,哈比比提到,以前从零开始训练阿尔法狼需要三个月,但现在只需要一周(“我们还优化了性能。以前,从头开始训练新版本的AlphaGo需要3个月的时间。现在我们可以在一周内完成。”)。
如果在与李世石的战斗中,版本被称为v18迭代版本,伪装成master60连胜,并宣布升级完成为v25版本,现在有多少个版本的alphago,它将不会需要一个星期的训练?这就是我们明天将亲自询问深度思维团队的问题。
从单人到团队都很小心的朋友们一定注意到,除了柯杰和阿尔法戈之间的比赛外,5月26日上午还会有一场比赛。比赛的双方——Coulie+alphagov+Lian Xiao+Alphago,即比赛的双方分别由一个玩家和Alphago组成,玩家与alphago合作进行比赛。5月26日上午和下午,、周瑞阳、严玉妍、、唐·和阿尔法戈将进行一场5:1的小组赛。
谷歌敢于建立竞赛系统的唯一解释是,alphago现在既了解人类玩go的部分,也了解人工智能玩Go的部分,并且能够通过全面的学习掌握,因此它敢于挑战与另一个同伴高度协调的竞赛系统,也敢于挑战检验其“战斗力”极限的团队竞赛。人工智能最可怕的部分不是它有多强大,而是它开始理解如何与周围环境“互动”。这种整合比去年三月的人机战争更可怕吗?
摘要:上次阿尔法戈伪装成大师测试时,柯杰已经输给了大师一次。他没见过艾戈的威力,但结合柯杰今天在现场的冷静表现,以及他昨晚莫名其妙的深夜感觉,我们有理由相信,这并不是一个比艾戈更好的玩家或者人类的围棋玩家。deepmind团队必须有一些未解决的答案,需要在游戏中给出一个肯定的验证,然后在这个方向上更进一步。
雷锋的人工智能技术评论当场报道,并拒绝未经许可转载。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
来源:搜狐微门户
标题:经过一年的修炼,AlphaGo的哪些能力突飞猛进了?
地址:http://www.shwmhw.com/shxw/62069.html