本篇文章2802字,读完约7分钟
5月23日,第二场“人机战争”拉开帷幕。去年,他以大比分击败了韩国选手李色基的阿尔法戈,并再次与柯杰等中国顶尖选手交手。比赛采用中国规则,三盘棋,不管输赢,每一方持续3小时,每分钟5次。因为阿尔法戈展现了超强的力量,在之前与李师义的战斗中几乎是通过“粉碎人类”赢得了胜利,许多业内人士认为,人类在第二次人机战争中几乎没有希望。
在去年第一次人机大战之前,搜狗首席执行官王小川在智湖发表评论,明确表示阿尔法戈将彻底击败李师义。对于这场比赛,他再次在智湖表达了自己的态度:“我们关心的不再是机器是否会赢——而是机器将以什么样的姿态打败人类。”
王小川说,阿尔法狼2.0和1.0的技术原理有很大不同,更贴近人们。因此,这场比赛最大的吸引力在于,阿尔法狼2.0可能经常出现“奇怪的把戏”,完全颠覆了人类对围棋的理解。阿尔法戈告诉我们,我们还有很大的发展空间空;然而,阿尔法狼2.0告诉我们,如果有合适的条件,可能会有其他的进化路径和不同的进化结果,这相当于重复一个进化史。
以下是王小川之湖的全文:
是时候来了。
阿尔法戈一年前就发布了,看完报纸后,我在智虎上发布了预言,机器将战胜人类。业内很多朋友都不相信,所以我收了很多“智商税”,然后微信红包一直发到了春节。此外,我还提出了两个主张:一是谷歌有可能重新开发alphago 2.0,摆脱“监督学习”,不再需要人类玩go的历史数据,而是只有通过“强化学习”,两个alphago学会如何自己下棋,达到顶峰。从公开信息来看,这是真的。这是什么意思,有什么可看的?
显著的技术进步:它与1.0的原则有很大不同,更贴近人们
Alphago 1.0巧妙地混合了三种算法:蒙特卡罗树搜索+监督学习+增强学习。蒙特卡洛树搜索是一个优化的蛮力计算,它比1997年的深蓝色蛮力计算更聪明。这里的监督学习是通过学习3000万步人类象棋来模仿六个以上职业玩家的游戏规则,也是阿尔法围棋取得突破性进展的关键算法。在强化学习的帮助下,两名阿尔法战士从自己的对手那里学习如何下棋。据报道,象棋实力的提高是有限的。
根据公共信息,alphago2.0的技术原理与以前大不相同:
1.放弃监督和学习,不再训练3000万盘棋。这是alphago最引人注目的算法,也是当今主流机器学习不可避免的核心条件:依靠高质量的数据,在这个特定的问题下又被打破了。
2.蒙特卡洛树搜索被放弃,暴力计算被停止。理论上,算法越愚蠢,就越需要暴力计算的补充。算法越聪明,计算就越不激烈。从alphago 2.0的“背心”大师的历史行为来看,每10秒下一盘棋的速度非常快,所以速度很可能会放弃暴力计算。
3.大大加强了强化学习的作用,而以前的敲鼓算法正式成为了主力军。想想它是多么鼓舞人心:两台白痴机器,遵守下棋和赢球的规则,开始不分昼夜地随机下棋,总结经验,不断地批评和自我批评,在一周内变得伟大。
在这样的算法下,alphago 2.0在计算资源上的开销非常小,并且当前的象棋游戏被输入到神经网络中,电流流过并且输出是最佳的象棋移动方案。我想用这个算法,只用一个图形处理器就可以工作,而且每个游戏的能耗接近人脑。
最大的吸引力:阿尔法狼2.0完全脱离了人类的经验
今年年初,阿尔法戈化身为大师,连续赢得了60场顶级人类玩家的比赛。在围棋领域,机器胜利已经成为公认的结论。这让很多人问:这场人机战争还有意义吗?我们关心的不再是机器是否会赢,而是机器将以什么样的姿态打败人类。
阿尔法戈已经学会了3000万步人类象棋,下棋的风格与人类相似。在游戏场景中,阿尔法戈偶尔会下棋,这与人们的经验不一致,因此被评为“愚蠢”。只有在中间游戏之后,人们才发现机器逐渐占据主导地位,并最终获胜。为了证明这一点,它被解释为“阿尔法戈在中间游戏中逆转”,这是前两个游戏。在第三场比赛开始时,解说员吸取了教训,开始以赞赏和敬畏的态度称呼阿尔法戈为“老师A”。这给围棋界带来了巨大的冲击。以前大家都认为是对的,实际上是错的。柯杰曾评论说:“阿尔法哥出现了,很多理论被推翻,然后以前的公式变得有趣。”如果你失去了这么多的眼睛,你将不再是两分。”经过几千年的实战,人类总结出围棋的理论,然后电脑告诉人类所有这些都是错的。现在,在许多比赛中,人类棋手已经开始向机器学习并模仿阿尔法戈的动作。棋圣聂卫平曾说“理论被颠覆了”。
而alphago2.0则打破了机器对人类的模仿,下棋的风格也将彻底打破人类的刻板印象。在与柯杰的比赛中,我们会有意想不到的动作,这些动作会被认为是低级错误或在教科书中完全不合理。然而,一个普通的棋手不会这样玩,但是一个新手会被指示这样玩。阿尔法狼2.0将继续制造这样的局面,关键是他是对的。我可以想象这对职业棋手的心灵是多么的震撼:我一生中不仅从未想过要下这样的棋,而且围棋的整个世界也从未想过。你会怀疑你是在白活吗?你会反思为什么围棋在2000年的发展会出现这样的瓶颈吗?空有多少辽阔的海洋等待我们去探索?等不及我们去探索,电脑会给出最后的答案,多么忧郁。
我们将讨论阿尔法戈是什么样的。但是它可以被推理如下:哪里有流派和风格,哪里就有限制。只有当所有的学校都团结起来,没有一所学校能被看到时,它们才能达到高水平。阿尔法戈2.0将是这样一台机器,没有风格和坚如磐石。
可想而知,这款与柯杰一起玩的游戏能够频繁展示“奇招”,彻底颠覆人类对围棋的理解——这将是这款游戏最大的吸引力。英勇的柯杰不得不打开108个阵地进行抵抗。
2017年人机战争的意义:重复进化史,重新理解智慧的边界
在2016年阿尔法戈和李士布之间的战斗之后,人工智能进入了公众的视野,我们开始重新思考机器和人之间的关系。
围棋已有2000多年的历史。在长期的思考中,围棋理论不断发展,达到了很高的水平。阿尔法戈的胜利可以理解为“照耀你”。毕竟,这是人类进化的主要途径。
然而,阿尔法狼2.0完全抛弃了人类在过去两千年中进化的经验,找到了另一条路。只有两台机器在自我游戏中学习和进化。最终,它不仅超越了人类进化的速度,还发展出了一种完全不同的下棋方法,更接近完美状态,实现了对人类的粉碎,重复了围棋的进化史,获得了与过去两千年不同的进化结果。
这会给我们什么启示?如果我们跳出围棋的规则,我们可以通过类比看到地球上生命的进化:人类已经逐渐从原始的有机物转变为单细胞生物,转变为灵长类动物,并发展出超越所有其他生物的智慧。这条路是独一无二的吗?人类生命形式离顶级生命形式有多远?阿尔法戈告诉我们,我们还有很大的发展空间空;阿尔法狼2.0告诉我们,如果有合适的条件,可能会有其他的进化途径和不同的进化结果。
让我们为人类的智慧创造了阿尔法戈而欢呼,阿尔法戈也让我们睁开了眼睛,看到我们离最终的生命形式和智慧仍然很远。
保持敬畏,坚定地前进,最终达到完美。
来源:搜狐微门户
标题:王小川点评人机大战:AlphaGo2.0将重演一部进化史
地址:http://www.shwmhw.com/shxw/62131.html