本篇文章2902字,读完约7分钟
小睡一会儿。我想离开三里屯的团结湖地铁站,经过望京的家乐福,然后去南锣鼓巷,最后到我家。我想要没有交通堵塞的最快路线。请帮我计划路线。
再说一遍,我会帮你导航。
两个月前,百度地图语音助手被一名狂热的网民骚扰,并将视频发到网上。在视频中,虽然小肚鸡肠没有给出一个合适的路线方案,但它的回答可以说是非常诙谐。
两个月后,在百度ai开发者大会上,百度高级副总裁兼ai技术平台系统(aig)总经理王海峰再次展示了同样的指示。小肚给出的答案是:要提供一条规划好的路线,你需要导航吗?这一次,小杜不仅理解了,而且给出了正确的反馈。
百度高级副总裁兼人工智能技术平台系统(aig)总经理王海峰
小肚是一个勤奋的同学。经过这段时间的学习,他已经学会了如何回答这个复杂的问题。王海峰说,在这背后,除了地图本身的技术,实际上还有百度大脑语音识别和自然语言处理合成技术的支持。
百度脑是李彦宏在2016年百度世界大会上正式发布的超大规模神经网络。经过多年的技术升级和R&D的投资,百度已经成为人工智能的大师。
百度人工智能布局:18年的积累和投资
要谈论百度的人工智能布局,必须追溯到它建立之初。
18年前,百度作为一家搜索公司诞生了。当时,搜索引擎还是一项基于统计的技术。然而,随着互联网的快速发展,在各种用户需求和海量数据处理需求下,搜索引擎越来越依赖人工智能和机器学习技术。
因此,2010年,百度开始全面部署人工智能技术,包括语音识别、自然语言处理、机器学习、知识地图、视觉语义等。两年后,我开始开发深度学习技术,并将其应用到百度的图像、语音等具体应用中。
鉴于深度学习技术在实际应用中的惊人表现,百度Be于2013年正式成立了idl(深度学习研究所),众多知名专家纷纷加盟,不断祝福其人工智能技术的改进和推广。除了中国,百度深度学习实验室也位于美国硅谷,离苹果不远。基于此,百度率先将深度学习技术应用于全球大规模在线搜索引擎,并推出了基于深度神经网络的机器翻译系统。
就这样,经过16年的技术积累和投资,百度大脑在2016年百度世界大会上正式推出。现在,它有数万亿个参数,数千亿个样本,数千亿个特征训练,甚至可以模拟人脑的工作机制。从基础层、感知层、认知层和平台层来看,百度不仅可以在内部提供完整的人工智能技术支持,还在去年7月宣布,已经开发了核心人工智能功能,包括语音识别、理解和交互技术单元、人脸识别和深度学习平台paddlepaddle。
百度人才基础设施
在过去的两年里,从1.0版的基础能力到2.0版,已经形成了一个完整的技术体系,60多个人工智能核心能力首次开放。3.0版发布后,百度的大脑能力仍在提高。
具体来说,百度脑科3.0的发布包括两个方面:技术升级和开放升级。在技术层面,百度脑3.0首次提出了多模态的行业深度语义理解,形成了从芯片到深度学习框架、平台和生态的人工智能全栈技术布局;在开放层面上,百度ai开放平台不断升级,是最完整、最前沿、最开放、最动态的ai技术平台。
据王海峰介绍,截至百度人工智能开发者大会上午,他看到的百度人工智能功能数量为117个。
百度大脑3.0:关注多模态深层语义理解
百度脑3.0的核心是多模态深层语义理解,具体指对多模态数据和信息的深层多维语义理解,包括数据语义、知识语义、视觉语义、语音语义整合和自然语言语义。
换句话说,机器必须听得清楚,看得清楚,这样才能深刻理解语义和现实世界背后的含义,更好地支持各种应用。其中,百度地图语音助手是结合语音语义整合和自然语言处理技术的最典型的应用场景之一。
王海峰介绍,在百度的高噪声环境下,免提语音识别的准确率提高了10个百分点,语音和语义的融合使远场语音识别的准确率提高了10个百分点;在语音合成方面,wavenet+拼接的情感语音合成技术大大提高了流畅度和自然度。
此外,他还以对话理解和阅读理解为例介绍了百度的自然语言理解技术。事实上,百度的对话理解技术已经积累了多年,最新的深度注意力匹配模型已经在百度大脑3.0中开发出来,比最知名的结果高出4.1%。在阅读理解技术方面,百度大脑已经阅读了数千亿篇文章,相当于中国国家图书馆的6万个馆藏,积累了数亿个实体和数千亿个事实。
更有趣的是,借助视觉语义技术,百度大脑也被应用到世界杯视频分析场景中。在会议现场,王海峰播放了一段世界杯视频。在视频中,百度的大脑可以捕捉镜头、目标、角落、替换等。通过识别视频中的裁判、球、球门和球场线,并完成机器人解释、亮点编辑和数据统计分析。
知识是机器理解世界的重要基础。正因为如此,百度也建立了一个庞大的知识地图,包含了数亿个实体和数千亿个事实的多语义知识。除了由实体、属性和关系组成的基本实体地图之外,还为不同的应用场景和知识形式构建了各种地图,如焦点地图、事件地图、多媒体地图和行业知识地图。所有这些构成了百度大脑的基础。
通过知识的不断获取和积累,百度大脑的理解能力和智能水平将不断提升,从而更好地为用户服务。王海峰说。
Paddlepaddle3.0:所有版本和平台都经过完全优化
必须强调的是,深度学习平台paddlepaddle在百度脑3.0多模态深度语义理解技术的突破背后发挥了重要作用。在会议上,王海峰正式宣布了paddlepaddle3.0,包括一个完整的核心框架,以及ai studio、autodl、easydl和其他平台,这些平台使开发人员能够平等、方便地获得ai功能。
其中,paddlepaddle3.0核心框架全面优化了服务器版本和移动版本,可以灵活应用于更广泛的开发需求;Autodl可以更加高效、自动地搜索神经网络结构,开发人员无需特殊硬件设备就可以快速获得高质量的模型;Easydl可以满足零算法基础训练业务的定制模型,用户可以通过可视化操作快速入门,无需深入学习;Ai工作室具有云集成、易用、高效和资源免费的特点。它是一个集数据、算法和计算能力于一体的paddlepaddle培训平台,可以一站式满足用户学习、先进技术和学术研究的需求。
此外,据王海峰介绍,此次会议的亮点之一——昆仑山人工智能芯片也将与paddlepaddle深度学习框架深度融合,从而推动人工智能产业生态的快速发展。
可以看出,越来越多的行业正在接受人工智能并使用这些能力。
据了解,从去年11月的百度世界大会到现在,才过去了半年多的时间,百度ai平台上语音能力的通话量增加了94%,视觉能力的日通话量增加了416%,自然语言处理的日通话量增加了180%。此外,视觉中人脸识别技术的调用次数增加了近八倍。
这些显著的增长只是开始。由于开源和开放,人工智能正在渗透到经济和社会的毛细血管中。李彦宏在他的演讲中说了这些。
在这个过程中,百度扮演着教人钓鱼的角色。它不仅通过人工智能开放平台让每个人平等地使用人工智能技术,还汇集了许多开发者的努力,不断增强百度大脑的迭代和升级能力。此外,在百度的ai生态伙伴燎原计划和ai加速器的帮助下,百度不断构建和布局自己的生态系统,从而为开发商释放更多价值,为产业升级带来更多想象。
来源:搜狐微门户
标题:百度大脑3.0:让机器听清、看清、理解真实的世界
地址:http://www.shwmhw.com/shxw/50555.html