本篇文章1887字,读完约5分钟

大规模数据收集和处理能力的飞跃为人工智能的巨大进步奠定了基础。然而,越来越多的证据表明,人工智能领域正准备进入一个新的高度。人工智能不仅能想象现实世界,还能开始准确判断什么是真实和重要的,什么是不真实和不重要的,从而预测接下来会发生什么。

谷歌公司(Google Inc .)的研究科学家卡尔·冯德里克(Carl vondrick)最近在旧金山的深度学习峰会(Deep Learning Summit)上发表了一篇演讲,他说:“计算机非常擅长记忆,但问题是教它们太难忘记了。”

冯德瑞克的研究聚焦于当今世界最困难的挑战之一:如何使用大量无处不在且无标签的视频数据库。嘲笑可爱的婴儿或有趣的猫视频是一回事,但从视频中获取信息是另一回事。

从视频中学习谷歌研究小组认为,最好的方法是利用数百万未标记的视频时间来训练深度学习神经网络(dnn)以更好地了解世界。利用大量可用的材料,网络利用人工智能技术不仅可以准确地描述它所看到的,还可以预测接下来会发生什么。

在这次峰会上,冯德里克展示了人们相互交流的视频,然后网络分析了基本正确的结果。拥抱、握手或击掌通常是基于视频捕捉到的人际行为。

深入的学习研究很重要,因为人们越依赖机器,就越需要机器来辨别观察到的人类行为。如果一个人靠近门把手,机器人决定在这个时候关门是非常不合适的。

有趣的是,谷歌研究人员一直在扩展深度学习模型,将声音包括在内。峰会与会者听到了一段歌唱生日快乐的音乐,当视频图像显示出来时,网络正确地预测到视频中会有蜡烛。冯德瑞克解释说,深度学习系统在预测行为方面进展顺利,准确率为74%,比人类高10个百分点。

冯德立克坦率地说:这项任务仍然非常困难,我们不能总是得到正确的结果。

冯德瑞克的研究基于一种叫做积极学习的方法,这种方法实际上让两种网络相互竞争。一个网络产生真实图像,另一个网络分析这些图像并确定这些图像是真还是假。谷歌大脑研究员伊恩古德费勒(ian goodfellow)最近采用了这项技术,他已经成为生成性对抗网络(gan)领域的权威。

在古德费勒的作品中,甘创造了真实世界的照片和声音。古德费勒说:gan是基于博弈论的一代模型,它为广泛的工程任务打开了大门。

这些任务包括各种深度学习模式,在这些模式中,机器可以被要求把一匹棕色的马变成一匹斑马。在峰会的一段视频中,一匹马渴望在动物园里尝试,斑马条纹完美地展示出来。因为电脑从非洲大草原拍摄的图像中发现了斑马条纹,背景中有一些棕色的草。

为了理解书面文字的上下文,机器需要理解书面文字的上下文。也许更重要的是深度学习的进步,也就是说,训练计算模型来理解人们的情况。在艾伦的艾伦人工智能研究所,研究人员正在从在线数据库中读取大量未标记的文本数据,以训练大规模的语言模型。

这里使用的关键方法结合了语言模型或elmo表示的嵌入。艾伦研究所的研究科学家马修·彼得斯说:“埃尔莫的表达是有语境的,取决于所用的整个句子。”

在这次峰会上,彼得斯展示了这项技术如何使网络能够正确解释像游戏这样的简单单词背后的意图,根据其在句子中的用法,这个单词可以有多种含义。三分球可能意味着与代表党的代表完全不同的意义。计算机正在通过训练完整的句子而不是有限的单词定义来学习如何做到这一点。

人工智能移动人工智能也在向移动设备扩展。facebook人工智能摄像团队开发了一种新技术,mask r-cnn2go,它可以检测身体姿势,并准确地将图像与背景分开。这不是一个容易解决的问题,因为实时检测身体运动是一个混乱的过程。衣服、运动和附近其他人或物体的存在会干扰。人工智能网络必须能够排除图像的其他部分,以便准确检测和跟踪人体姿态。换句话说,它必须学会忘记。

这一年,人工智能对未来的预测越来越准了

facebook的研究工程师安德鲁·图洛克说,facebook人工智能实验室(fair)最近发布了基于开源代码的mask r-cnn平台。在facebook庞大的移动用户社区中使用这款应用凸显了它的未来潜力。这是一个巨大的机会,图洛克说。

深度学习应该走多远?本月早些时候在拉斯维加斯举行的消费电子展上,游客们看到,从人工智能控制的猫宠物玩具到人工智能驱动的站立式办公桌,甚至连流行文化偶像贾斯汀·鲁汀·布莱克也加入了派对,最近还发布了一段以人工智能为主题的视频。

英伟达(NVIDIA)人工智能基础设施副总裁克莱门特法拉贝特(Clement farabet)表示:深度学习现在几乎成了一种商品。这意味着我们只能看到人工智能技术如何改变我们日常生活的开始。

资料来源:siliconangle

汇编人:科技沃克

来源:搜狐微门户

标题:这一年,人工智能对未来的预测越来越准了

地址:http://www.shwmhw.com/shxw/41924.html