本篇文章5752字,读完约14分钟
围棋,人类最强大的大脑,终于宣布彻底失败。但不是我们不给予力量,而是我们的对手,而不是人...
资料来源|黑之(身份证号:VR-2014)
文|黑军
事实上,不管柯杰在今天的棋局中表现如何,阿尔法戈在5月23日和5月25日连续两次获胜,而这个结果从前天就已经锁定了。昨天,有一场比赛和一场团体赛。在团体赛中,五名中国世界冠军携手对抗阿尔法戈,最后输给了黑254。
围棋,人类最强大的大脑,终于宣布彻底失败。
围棋似乎离我们的生活很远。然而,我们能简单地把乌镇的这场棋赛看作一场娱乐表演吗?
对一些人来说,情况似乎就是这样。我们还没看到阿尔法戈如何改变我们。
但对其他人来说,这是一个可怕的开始。机器会像我们一样思考吗?它比我们强大,不需要受到情感、情感和身体因素的影响。如果它配有一个强大的大脑,它还能做什么?
有许多问题我们可以思考。为什么阿尔法戈如此强大,以及人类在机器面前是否没有反击的空间;除了下棋,阿尔法戈还想告诉我们它能给未来带来什么;还有,下一个游戏,人类和机器,在什么战争中对抗?
阿尔法戈在游戏中有多可怕?
我已经非常擅长拼写了。让阿尔法戈的主机变热很好。
作者:柯杰
在今天的第三场比赛中,在前一场比赛失利后,柯杰提出,本届议会仍应由他来主导,哈比比欣然同意。在第三场比赛中,柯捷回归自然成为了自己,不再受对手的影响。然而,阿尔法戈仍然在开始时将第一只手放在右下角。双方的前四手牌都有规律地开始,但随后阿尔法戈以新手身份出场,柯杰开始了漫长的考试,最后他别无选择,只能领先。
让我们回顾一下之前的国际象棋比赛和阿尔法戈让我们吃惊的地方。
1.是阿尔法戈刻意赢得半只眼睛吗?
在第一场比赛中,柯杰以小眼睛和三分球领先。4小时17分37秒后,289手牌激烈对抗,阿尔法戈以1/4获胜。虽然这是中国规则中最小的差距,但最可怕的是比赛结束后,人们猜到了这个结果:这是阿尔法戈故意设置的?
到第一场比赛的中间,阿尔法狗几乎领先一球。然而,在那之后,它采取了保守的方法,没有土地是有争议的。赛后下国际象棋时,柯杰苦笑着说:我知道我会输1/4,阿尔法戈以恒定的速度下国际象棋,即使是在最后的单人正式赛阶段,所以我有时间下国际象棋。
独立it评论员Keso在赛后第一时间评论道,阿尔法戈可能是故意的。
但是业界对此也有不同的看法。毕竟,对于电脑来说,阿尔法戈的目标是赢,而不是赢得几只眼睛。阿尔法戈给了自己用最安全的方法获胜的命令,即使只有半眼。极客帮助风险投资公司的合伙人江涛认为,这一说法还不能得到证实。然而,他也认识到,如此微妙的情况最终表明,象棋比赛是在阿尔法戈的控制之下。毕竟,它想要确保的是结果的胜利。对于赢得1个网格或赢得10个网格,计算机的判断是相同的。
2.模仿你的对手开始?柯杰的评价几乎是完美的
5月25日,第二场比赛开始了。
比第一场战斗更出人意料的是,当天中午13点37分,柯杰主动认输,阿尔法戈提前一个多小时赢得了中间的比赛。
在第二场比赛中,阿尔法戈领先。但在开始之前,它有不同的想法,最后选择了第一个游戏,它是由柯杰用小眼睛和三个或三个。
这很有意义。你知道,自从阿尔法戈公开亮相后,在这场人机大战之前,一共进行了70场比赛,其中包括与范辉的5场比赛,与李世石的5场比赛,以及以大师的名义进行的60场比赛。在这70个站中,他们离开了三个或三个而没有开始游戏。
而柯杰在这场比赛中相对比较冷静。由此可见,本会在科捷的布局策略上付出了更大的努力。即使在前十几手牌中,你也能预料到阿尔法戈多步棋的下跌。比赛进行了一个小时后,deepmind的创始人、阿尔法戈的父亲哈比萨斯在自己的推特上说:“我真不敢相信。”根据阿尔法戈的判断,柯杰现在打得很好。
有传言说阿尔法戈不擅长抢劫,但在本会,阿尔法戈很好地处理了柯杰引发的抢劫纠纷,并没有完全避免抢劫。
在左下角的抢劫案中,柯杰的失误使情况突然变得不可逆转。经过近20次尝试,柯杰投出了155手。
这场棋赛的震撼是无与伦比的。在赛后新闻发布会上,双方都承认阿尔法戈在当天的比赛中根本没有表现出获胜的百分比优势。Deepmind还表示:科杰在竞争中有很多机会,阿尔法戈一度无法与我们这样的开发商打交道,也从未见过阿尔法戈如此势均力敌。
这可以说是迄今为止人类棋手对抗阿尔法戈的最精彩的游戏。
3.阿尔法戈面对不利条件时应该做什么?放弃,迫使队友放弃
之后,最有趣和最令人沮丧的一幕出现在昨天的比赛中。根据本次比赛的规则,两名中国选手古力和连潇将分别与阿尔法戈组队。
以前,很多人都猜测阿尔法戈是故意输掉比赛还是下了一盘糟糕的棋。那么,当阿尔法戈真的面临劣势时,它是如何应对的呢?这个游戏可能会告诉你答案。
在比赛结束时,阿尔法戈,谁与库利合作,决定认输,但库利拒绝阿尔法戈的要求,并坚持战斗。在那之后,阿尔法戈的象棋比赛变得越来越消极。最终,库利不得不在不可逆转的形势下承认失败。
不管你怎么想,很明显阿尔法戈已经成为控制国际象棋比赛的关键。
阿尔法戈现在有多强大?
也许,许多关于alphago的问题可以在deepmind对其算法的解释中得到解释。
早在去年,阿尔法戈就已经以4:1击败了李师义。今年年初,恒空大师诞生了,他在围棋的两个网站——宜城和胡烨上与来自世界各地的顶尖棋手进行快速对弈,最终以60: 0的成绩横扫国际象棋界。游戏结束后,大师展示了他自己,这是阿尔法戈的最新版本。
而这一次在乌镇和柯街,它是主人。在年初的比赛中,柯杰已经在快棋中输给了它。
阿尔法戈大师和打败李师义的阿尔法戈·李有什么不同?第一场比赛后,deepmind首席科学家Silva在他的演讲中透露,去年与李师义交手的alphago lee有50个tpu在运行,以10000个位置/秒的速度搜索50个动作,而昨天击败柯杰的alphago master只在一个TPU上玩游戏,计算量只有去年版本的十分之一。
对抗柯杰的是阿尔法戈大师,他在年初击败了60位大师。
目前,alphago是一个独立版本。
配备4个TPU。
与去年3月与李世石的比赛相比,目前的版本在处理计算上只消耗了十分之一的能量。
目前,阿尔法围棋大师对柯杰的比分接近4800。
如今,阿尔法戈采用强化学习,这使得人工智能可以玩自我游戏,并产生更强的神经网络。这一次,阿尔法戈使用自我游戏训练的战略网络,可以直接给出下一个决定,而无需更多的操作。
相比之下,阿尔法戈的实力是去年击败李世石的阿尔法戈李的三倍。
四个tpu,独立版本,完全虐待人类。什么是强三子的概念?让柯杰的反应告诉你。
如果打败李师义的阿尔法戈利用体积和神经网络让它理解规则和象棋游戏,那么阿尔法戈就增强了它的思维能力,可以成为一个自学成才的人。
在本次比赛之前,很多媒体报道称,alphago 2.0可能采用了一种全新的算法模型,放弃了监督学习,也就是说,它没有先学习人类下棋得分的经验,而是通过战斗直接获得认知和能力。但是哈比萨斯在赛后新闻发布会上回答说,这显然是一个误会。阿尔法戈仍然需要从人类经验中学习,但是这个版本的阿尔法戈更依赖于自我游戏来学习。
席尔瓦解释说,如何让阿尔法戈进行监督学习和强化学习,就是让阿尔法戈通过训练形成一个战略网络,把棋盘上的情况作为输入信息,并生成所有可行位置的概率分布。然后,训练一个价值网络,并根据-1(对手的绝对胜利)到1(1的绝对胜利)的标准预测所有可行位置的结果。也就是说,在这个过程中,alphago不仅会计算出自己的最佳选项,还会根据自己下的象棋,通过多层处理形成一个值。高值表示你赢了,低值表示你的对手赢了,并判断这是否是象棋比赛中的关键一步。
此外,阿尔法戈的搜索算法可以添加类似人类直觉的判断,使其更接近人脑。
为什么选择象棋和纸牌?
那么,为什么科学家痴迷于让机器和象棋游戏变得困难呢?让电脑学会下棋对我们有什么好处?
原因很简单。首先,象棋和纸牌是人类智力活动的象征,它们的宣传和召唤能力自然是其他运动无法比拟的。
其次,很自然,象棋非常适合作为人工智能算法的基准。机器和人之间的游戏是一个游戏过程,具有抽象的特征,而棋牌游戏的规则非常清晰,状态显示也相对清晰。
在国际象棋和纸牌游戏中,围棋很难征服。众所周知,搜索算法的复杂性取决于分支系数每次移动的可能移动。相比之下,象棋的平均分支因子约为35,而围棋的平均分支因子为250,一局棋的步数为350,搜索树有250个350个节点,这就需要更复杂更先进的搜索算法。1997年之前,没有竞争性的围棋项目。
阿尔法戈击败了许多玩家,使用蒙特卡罗树搜索算法。借助价值网络和策略网络两种深层神经网络,通过价值网络对大量选择点进行评价,通过策略网络选择投放点。
神经网络系统是基于人脑的信息处理模型,可以根据特定的输入产生特定的输出,实现图像识别和语音识别等功能。谷歌已经制造了两个神经网络。一个神经网络用于动态评估和计算对手下一步行动的可能性。电脑远远超过了玩家的计算能力,这将在一定程度上占据一定的优势。另一个神经网络用于评估国际象棋比赛中交战各方的总体情况。
谷歌已经输入了大量的国际象棋分数,阿尔法戈已经根据这些分数进行了无数的自我比赛,以此来丰富其数据库并预测对手的行踪。
阿尔法戈获胜后,今年1月,在美国宾夕法尼亚州,卡耐基梅隆大学开发的德州扑克人工智能系统天平动系统击败了四位顶尖人类大师,一举赢得近20万美元和177万美元的筹码。
德普和阿尔法戈的围棋不同。像围棋、国际象棋和西部大陆这样的游戏,被人工智能一个接一个地打破,都是完美的信息游戏。也就是说,所有的玩家都可以在游戏中获得开放的对称的确定信息。游戏中需要做出的决策点数决定了机器的计算量。
相比之下,德普是一个不完全的信息游戏。它包含更多隐藏的信息。每个玩家都有不对称的信息。他只能看到自己的牌,但他不知道对手的牌。他需要根据直觉猜测对手的牌,选择下注和放弃,并判断对手的打法。因此,不完全信息博弈已经成为一个计算机难题。
天平动基于匹兹堡超级计算中心大约1500万核心小时的计算,使用算法来分析德普的规则,预测所有步骤的成功率,并执行其下一步。与alphago不同,它使用大量的象棋游戏进行训练,它不使用专业的手进行神经网络训练。取而代之的是,它使用随机生成的手牌(随机生成的公共牌、底池筹码、玩家拿牌的概率)和临时动作带来的结果(模拟玩家在随机生成的输入下跟牌的结果)作为训练数据。天平动也采用博弈论,通过纳什均衡来计算如何应对对手的战术,并通过平衡风险和收益来修正其下一步,以实现收益最大化。它的程序名天平动源于拉丁语的制衡。
是的,所以,你知道,麻将,在中国是一项受欢迎的民族运动,是一种不完美的信息游戏。目前,虽然有很强的人工智能,但与顶级人类高手相比仍有很大差距。
柯杰之后,也许我们可以期待一场高水平的麻将人机大赛。
然而,根据微软亚洲研究院的研究人员杨卯和秦涛的文章,最难被人工智能征服的游戏是《星际争霸》和《我的世界》。它们不仅在信息上不对称,而且在游戏规则上也是开放的。除了在运行速度上的优势,计算机还需要处理复杂的新情况。现在,计算机还没有在这些游戏中证明它们的能力。
下棋后阿尔法戈能做什么?
阿尔法戈赢了李世石,那又如何?玩围棋的最初乐趣是对手的坏棋。因此,这台机器不会下坏棋。重点是什么?
作者:马云
因此,我们可以认识到象棋比赛是人工智能的早期练习。也许它可以让游戏更有趣,挑战职业玩家的价值,并唤起许多人的想法和恐惧。然而,alphago,或deepmind,它的最终目标不仅仅是下棋。deepmind的最终目标仍然是智能助手、医疗和机器人领域。
谷歌现在有两个人工智能系统,包括谷歌的机器学习开发工具tensorflow和deepmind的alphago系统。阿尔法戈将在未来应用于医疗保健和自动驾驶汽车。
在乌镇举行的人工智能峰会上,alphabet董事长埃里克施密特(eric schmidt)谈到机器学习和人工智能引领着智能时代的发展。他说:神经网络的爆发和深度学习是我经历的最大变化。他还表示,这些新技术不仅提高了日常生产效率,还为企业带来了无限的机遇,特别是在医疗、交通和政务等领域。谷歌的人工智能研究成果也在这次交流中向国内观众充分展示。
比如机器学习在消费类产品中的应用,包括谷歌照片和gmail。以谷歌照片的最新版本为例,通过机器学习技术,照片中的雨滴可以被去除,过滤器可以被添加到照片中,使它们具有与众所周知的艺术作品相同的效果。
例如,如何使用计算机工具帮助缺乏医疗资源的国家更广泛地诊断眼病,包括印度。印度有13亿人口,总共缺少127,000名眼科医生。谷歌的机器学习模型在诊断眼疾方面的准确率甚至比美国认证委员会认证的一些眼科医生还要略高。该技术在其他疾病的诊断中有很大的应用潜力。例如,斯坦福大学的研究人员最近开始使用张量流动通过图像来诊断皮肤癌。
Tensorflow是世界上第一个基于github的机器学习知识库,其使用率增长率远远高于其他同类平台。比利时公司connecterra将Tensorflow应用于牧场,而澳大利亚研究人员则利用这一技术来判断海牛种群的健康状况。
Tensorflow也用于谷歌翻译。随着神经网络机器翻译的引入,翻译结果得到了显著提高。同时,结合计算机视觉,谷歌翻译应用可以使用手机摄像头进行即时图像翻译,这是在移动设备上通过张量流版本实现的。在文学和艺术领域,有肖像匹配器,这是一种可以使用相机将你的面部特征与类似的艺术品进行匹配的功能。
柯杰战后说:未来是人工智能。毕竟,人工智能是由人类开发的。
目前,我们不必担心人类将被机器完全取代和统治。李开复的答案是,人工智能只有在满足以下三个先决条件的领域才能完全击败人类:
首先,有大量的数据;
第二,数据有标准;
第三,单一领域。
在最近的信息技术领导人峰会上,李彦宏还表示:强大人工智能的时代可能永远不会到来。
也许,机器不值得我们害怕。但真正可怕的事实是,我们不知道人类会把它推向哪一步。
来源:搜狐微门户
标题:柯洁最终战失败!回顾AlphaGo全部对战过程,真正可怕的还在后面……
地址:http://www.shwmhw.com/shxw/62425.html