本篇文章3047字,读完约8分钟

这款与柯杰一起玩的游戏能够频繁展示“奇招”,彻底颠覆人类对围棋的理解——这将是该游戏最大的吸引力。

首次发布|黑色智慧(标识:VR-2014)

正文|杨洁

2017年5月23日,在第二次人机大战中,世界排名第一的中国围棋手柯杰输给了谷歌旗下的人工智能程序alphago。比赛持续了四个多小时后,柯杰输给了阿尔法戈,阿尔法戈赢了四分之一。然而,这不是最终结果。第二届和第三届运动会将分别在5月25日和5月27日举行。具体日程请参考黑智的报道,“柯杰明天将与阿尔法戈争夺150万美元的奖金。你想知道的都在这里。”

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

去年,他以大比分击败了韩国选手李色基的阿尔法戈,并再次与柯杰等中国顶尖选手交手。比赛采用中国规则,三盘棋,不管输赢,每一方持续3小时,每分钟5次。然而,柯杰这次的失败并没有超出大多数人的预料,因为阿尔法戈在之前与李师义的战斗中表现出了超强的实力,几乎是以击溃人类的方式取得了胜利,所以业内很多人都觉得人类在第二次人机大战中的希望渺茫。

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

在去年第一次人机大战之前,搜狗首席执行官王小川在智湖发表评论,明确表示阿尔法戈将彻底击败李师义。对于这场比赛,他在智湖再次表达了自己的态度:我们关注的不再是机器是否会赢,而是机器将以什么样的姿态打败人类。

王小川说阿尔法狼2.0和1.0的技术原理有很大的不同,它们更接近人类。因此,这场比赛最大的吸引力在于,阿尔法狼2.0可能经常出现奇怪的把戏,完全颠覆了人类对围棋的理解。阿尔法戈告诉我们,我们还有很大的发展空间空;然而,阿尔法狼2.0告诉我们,如果有合适的条件,可能会有其他的进化路径和不同的进化结果,这相当于重复一个进化史。

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

以下是王小川之湖的全文:

是时候来了。

阿尔法戈一年前就发布了,看完报纸后,我在智虎上发布了预言,机器将战胜人类。业内很多朋友都不相信,所以我征收了很多智商税。此后,微信红包一直被发送到春节。此外,我还提出了两个主张:一是谷歌有可能再次开发alphago 2.0,摆脱监督学习,不再需要人类玩go的历史数据,而是只有通过强化学习,两个alphago学会如何相互对弈,达到巅峰。从公开信息来看,这是真的。这是什么意思,有什么可看的?

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

显著的技术进步:它与1.0的原则有很大不同,更贴近人们

Alphago 1.0巧妙地混合了三种算法:蒙特卡罗树搜索+监督学习+增强学习。蒙特卡洛树搜索是一个优化的蛮力计算,它比1997年的深蓝色蛮力计算更聪明。这里的监督学习是通过学习3000万步人类象棋来模仿六个以上职业玩家的游戏规则,也是阿尔法围棋取得突破性进展的关键算法。在强化学习的帮助下,两名阿尔法战士从自己的对手那里学习如何下棋。据报道,象棋实力的提高是有限的。

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

根据公共信息,alphago2.0的技术原理与以前大不相同:

1.放弃监督和学习,不再训练3000万盘棋。这是alphago最引人注目的算法,也是当今主流机器学习不可避免的核心条件:依靠高质量的数据,在这个特定的问题下又被打破了。

2.蒙特卡洛树搜索被放弃,暴力计算被停止。理论上,算法越愚蠢,就越需要暴力计算的补充。算法越聪明,计算就越不激烈。从阿尔法戈2.0的背心大师的历史行为来看,每10秒移动一次棋非常快,所以速度很可能会放弃暴力计算。

3.大大加强了强化学习的作用,而以前的敲鼓算法正式成为了主力军。想想它是多么鼓舞人心:两台白痴机器,遵守下棋和赢球的规则,开始不分昼夜地随机下棋,总结经验,不断地批评和自我批评,在一周内变得伟大。

在这样的算法下,alphago 2.0在计算资源上的开销非常小,并且当前的象棋游戏被输入到神经网络中,电流流过并且输出是最佳的象棋移动方案。我想用这个算法,只用一个图形处理器就可以工作,而且每个游戏的能耗接近人脑。

最大的吸引力:阿尔法狼2.0完全脱离了人类的经验

今年年初,阿尔法戈化身为大师,连续赢得了60场顶级人类玩家的比赛。在围棋领域,机器胜利已经成为公认的结论。这让很多人问:这场人机战争还有意义吗?我们关心的不再是机器是否会赢,而是机器将以什么样的姿态打败人类。

阿尔法戈已经学会了3000万步人类象棋,下棋的风格与人类相似。在游戏场景中,如果阿尔法戈偶尔下棋,这与人们的经验不一致,就会被认为是愚蠢的。只有在中间游戏之后,人们才发现机器逐渐占据主导地位,并最终获胜。为了证明这一点,它可以被解释为阿尔法戈的中间游戏的逆转。在第三场比赛开始时,评论员学到了一课,并开始以欣赏和敬畏的态度称呼阿尔法戈为甲师。这给围棋界带来了巨大的冲击。以前大家都认为是对的,实际上是错的。柯杰曾评论道:阿尔法戈的出现推翻了许多理论。如果我们看看前面的公式,它会变得有趣。如果我们失去了这么多的眼睛,那就不再是两分了。经过几千年的实战,人类总结出围棋的理论,然后电脑告诉人类所有这些都是错的。现在,在许多比赛中,人类棋手已经开始向机器学习并模仿阿尔法戈的动作。棋圣聂卫平曾经说过,这一理论已经被颠覆了。

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

而alphago2.0则打破了机器对人类的模仿,下棋的风格也将彻底打破人类的刻板印象。在与柯杰的比赛中,我们会有意想不到的动作,这些动作会被认为是低级错误或在教科书中完全不合理。然而,一个普通的棋手不会这样玩,但是一个新手会被指示这样玩。阿尔法狼2.0将继续制造这样的局面,关键是他是对的。我可以想象这对职业棋手的心灵是多么的震撼:我一生中不仅从未想过要下这样的棋,而且围棋的整个世界也从未想过。你会怀疑你是在白活吗?你会反思为什么围棋在2000年的发展会出现这样的瓶颈吗?空有多少辽阔的海洋等待我们去探索?等不及我们去探索,电脑会给出最后的答案,多么忧郁。

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

我们将讨论阿尔法戈是什么样的。但是它可以被推理如下:哪里有流派和风格,哪里就有限制。只有当所有的学校都团结起来,没有一所学校能被看到时,它们才能达到高水平。阿尔法戈2.0将是这样一台机器,没有风格和坚如磐石。

可想而知,这款与柯杰一起玩的游戏可以频繁地展示奇怪的把戏,彻底颠覆人类对围棋的理解,这将是这款游戏最大的吸引力。英勇的柯杰不得不打开108个阵地进行抵抗。

2017年人机战争的意义:重复进化史,重新理解智慧的边界

在2016年阿尔法戈和李士布之间的战斗之后,人工智能进入了公众的视野,我们开始重新思考机器和人之间的关系。

围棋已有2000多年的历史。在长期的思考中,围棋理论不断发展,达到了很高的水平。阿尔法戈的胜利可以解释为照耀你。毕竟,这是人类进化的主要途径。

然而,阿尔法狼2.0完全抛弃了人类在过去两千年中进化的经验,找到了另一条路。只有两台机器在自我游戏中学习和进化。最终,它不仅超越了人类进化的速度,还发展出了一种完全不同的下棋方法,更接近完美状态,实现了对人类的粉碎,重复了围棋的进化史,获得了与过去两千年不同的进化结果。

这会给我们什么启示?如果我们跳出围棋的规则,我们可以通过类比看到地球上生命的进化:人类已经逐渐从原始的有机物转变为单细胞生物,转变为灵长类动物,并发展出超越所有其他生物的智慧。这条路是独一无二的吗?人类生命形式离顶级生命形式有多远?阿尔法戈告诉我们,我们还有很大的发展空间空;阿尔法狼2.0告诉我们,如果有合适的条件,可能会有其他的进化途径和不同的进化结果。

人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

让我们为人类的智慧创造了阿尔法戈而欢呼,阿尔法戈也让我们睁开了眼睛,看到我们离最终的生命形式和智慧仍然很远。

保持敬畏,坚定地前进,最终达到完美。

来源:搜狐微门户

标题:人机大战柯洁首局战败!王小川点评:AlphaGo2.0将重演一部进化史

地址:http://www.shwmhw.com/shxw/62134.html