本篇文章4640字,读完约12分钟
最近,吴恩达在斯坦福msx未来论坛的演讲描述了他眼中的人工智能世界。
本文由华创资本授权的黑马发行。
吴荣奎认为,人工智能(ai)将会给未来的许多行业带来变化,就像100多年前美国的电击一样,电已经给制造业、交通运输、农业(尤其是制冷)、医疗保健等带来了划时代的变化。人工智能推动了搜索和广告,人工智能也彻底改变了金融工程,实现了一半的物流转型。医疗和自主驾驶才刚刚开始,前景广阔。
监督学习
推动数百亿市场容量的基本上属于同一个人工智能:监督学习,也就是说,人工智能用于确定a-> b的映射输入a和响应B之间的映射..
使用电子邮件作为输入a来判断它是垃圾邮件还是回复b;
道路图像被用作输入来识别它是一千个物体中的哪一个;
从声音a到文本b,从英语到法语,或者从文本到声音的道路;
软件可以从输入A到响应B学习这些映射,并且有很多好的工具可以让机器学习。例如,50,000小时的音频和相应的文本可以使机器学习如何将音频内容转换成文本内容。垃圾邮件过滤器也可以通过大量的电子邮件数据和标签来快速识别垃圾邮件。
如今,人工智能仍然是从A到B的主要映射,但它已经推广了一个大市场。百度有一个很好的算法来预测用户是否会点击广告。向观众展示更多相关的广告可以为网络营销和广告公司带来巨大的赚钱机会。这可能是人工智能最有利可图的应用。
日本人工智能机器人Torobo-kun放弃了参加高考的计划,因为阅读理解的困难是不可克服的
在哪些产品中可以使用人工智能?
产品经理经常想知道人工智能能实现什么和不能实现什么。一个简单的想法是,普通人在一秒钟内想出的东西现在或很快就会被人工智能自动实现。
人工智能发展最快的领域正是人们能做的。比如自动驾驶。人类会开车,所以人工智能会开车。在医学图像阅读和分析中,人类放射科医生可以阅读电影,所以人工智能可能在未来几年内做到这一点。
人工智能也可能很难做一些人类很难做的事情,比如预测股市的变化。
理由1:人类能做的至少是可行的;
原因2:人的数据可以用作训练样本,例如前面提到的输入A和响应B;
原因3:人类可以提供指导。如果人工智能对某个放射图像做出错误的结论,设计者可以问医生医生做出正确结论的原因是什么。然后提高人工智能;
在安德鲁.吴接触到的80-90%的人工智能项目中,他们都遵循这样的规则:人工智能在人类能做的领域取得了更快的进步。一旦许多项目的发展超过了人类的标准,发展就会变得缓慢。这也带来了一个社会矛盾:如果人工智能与人类水平相似,那么它实际上是在与人类竞争。
人工智能的发展趋势
艾出现了几十年,但近五年来发展明显加快。为什么?
当先前的机器学习算法的性能上升到一定程度时,即使数据样本量增加(上面提到的输入A和响应B的a-b映射),性能改善也是有限的。似乎在超过一定的样本量后,没有多少数据对算法有效。
在过去的几年里,主要由于图形处理器,我们终于实现了机器学习软件,可以利用如此巨大的数据集。将数据输入一个小的神经网络,当它超过一定的性能时,上升变得平稳。当数据被连续输入到一个大的神经网络中时,即使它没有上升得那么快,性能也会继续上升,并且会随着数据量的增加而不断提高。
因此,为了获得良好的人工智能性能,需要做两件事:
A-b映射的大道路数据集;
鲁大神经网络。目前,常用的大规模神经网络都建立在高性能计算集群上。
今天的大型人工智能团队由两组组成:机器学习和高性能计算。百度人工智能团队中的这两类人都专注于各自的领域,没有人能两者兼得。
什么是神经网络?有可能取代人脑吗?
问题是我们不知道人脑是如何工作的,所以很难建立一个神经网络来代替人脑。
什么是神经网络?先看看最简单的神经网络:
如果你想输入房子的面积并得到房子的总价格,你可以用面积-总价格的一阶近似线性模型来描述这个神经网络。
或模型与更多的因素,如大小和卧室数量,并获得家庭数量,可以支持从第一个神经元。然后通过地址的邮政编码和社区的丰富性从第二个神经元获得附近学校的质量。
这变成了一个神经网络。面积、卧室数量、邮政编码和社区富裕程度属于输入集a,总价属于响应集B..
其优点是,当训练这种神经网络时,用户不需要关心中间因素,如家庭规模、安全性、学校质量等。,以及每个神经元如何将输入映射到中间结果。只需给出输入集A和响应集B,神经网络将自动形成中间计算过程和参数。当A和B的集合足够大时,神经网络可以自动计算许多事情。神经网络看起来很简单,这让许多初学者感到有点失望,但它确实可以解决许多问题。关键是数据量应该足够大。数万或数十万个样本可以提供大量信息,而软件本身只是一小部分。
如何保护人工智能业务?
处于人工智能研究前沿的团队更加开放,经常发布研究结果。百度的人工智能研究论文没有隐藏任何成果。所有的细节都在论文中分享,比如人脸识别。既然很难隐藏算法本身,如何保护人工智能业务?目前有两种稀缺资源,一种是数据,另一种是人才。包括输入a+应答b在内的海量数据很难得到,比如语音识别已经花了5万个小时的音频训练,今年要花10万个小时,相当于百度过去10年积累的音频。
以用于人脸识别的训练图像数量为例,
道路科学中最常用的基准测试/竞赛:100万次;
在道路上使用最多图像的计算机视觉物体识别学术论文:1500万;
百度鲁用来训练世界上最先进的人脸识别系统:2亿!
如果只有一个5-10人的R&D团队,很难获得如此规模的数据。像百度这样的大企业经常推出一些新产品,不一定是为了收入,而是为了数据,然后通过后续产品获得利润。
另一种稀缺资源是人才。人工智能的应用需要根据具体的业务场景进行定制。仅仅下载一个开源包并不能解决问题。实际上,使用一些垃圾邮件识别或语音识别技术合适吗?如何在特定场景中使用机器学习?因此,公司正在为数据挖掘、定制人工智能技术、找出A和B代表什么、如何找到这些数据以及如何调整算法以适应业务场景而争夺人工智能人才。
人工智能的良性循环
先做一个产品。例如,通过语音识别,搜索是通过语音实现的;
这条路吸引了许多用户,用户产生数据;
通过机器学习,使用数据来改进产品;
这就形成了人工智能产品的良性循环。最好的产品可以得到最多的用户,带来最多的数据。通过现代机器学习系统,他们可以得到最好的人工智能,并最终使产品更好,并继续下去。
良性循环的想法已经存在了很长时间,但最近变得更加明显。如上所述,当数据超过一定规模时,传统的人工智能算法不能显著提高人工智能的性能,因此数据多的优势不明显,大公司很难保护自己的人工智能业务。现在,数据越多,人工智能性能越好,大公司也更容易保护自己的优势。
谷歌已经成为人工智能领域最具创新性的公司之一
人工智能产品管理
人工智能是一个激动人心的领域,但也有一些挑战。如何将人工智能融入公司业务?
产品经理的职责是发现用户喜欢什么,而工程师的角色是制造可行的产品。只有两者共同努力,我们才能制造出理想的产品。
艾是一个新生事物,所以以前技术公司的流程和工作方法都不适合。硅谷的产品经理和工程师之间有一个标准的合作过程。例如,当开发一个应用程序时,产品经理首先绘制一个线路图,如徽标、按钮、各种标牌等。,然后工程师编写代码来实现它。但是人工智能应用不能用拉丝来描述。在产品经理的头脑中,人工智能产品的功能需求能以什么形式清晰地与工程师共享?
例如,开发语音识别系统和实现语音搜索有许多改进方向。例如:
如何在嘈杂的环境中改善道路,比如汽车或咖啡馆?
道路只改善窄带语音信号;
针对不同口音的道路改善;
百度发现,产品经理通过数据与工程师沟通是一种更好的方式。产品经理负责向工程师提供测试数据集,如10,000个音频和相应的文本,以解释相关问题,工程师可以更好地理解要解决的问题。如果这些音频中有大量的车辆噪音,工程师就会知道车辆噪音是一个问题。如果是几种不同噪音的混合,工程师可以找到解决办法。在最坏的情况下,产品经理提供的测试数据不能代表你想要解决的问题,然后就出问题了。
同时,新产品设计有许多过程,例如设计一个交流人工智能机器人:
男:我想点一份外卖。
-艾:你喜欢哪种餐馆?
-人:川菜
-ai:这些是可选的,xxx,yyy,zzz,...
线框只能显示对话过程,但不能描述所需人工智能的复杂性。百度的产品经理和工程师将会聚在一起写50种对话。
男士:请为我的结婚纪念日预订一家餐馆
-艾:你需要订购鲜花吗?
这时,工程师会问一些更具体的问题,比如每个场景是否需要继续问一些关于配套产品的问题。例如,当谈到圣诞节时,你想问对方是否想买圣诞装饰品吗?一起思考,一起讨论需求和技术是非常有效的。
在人工智能的推广中有许多引人注目的技术,但它们可能不是最有用的。如何将引人注目的技术与产品和业务相结合?软件行业已经有了标准流程,比如代码审查、敏捷开发等等。组织人工智能产品工作还有很长的路要走。现在是考虑这些问题的时候了。
人工智能在短期内有什么机会?
语音识别正在兴起
最近,精确度已经提高到非常有用的水平。4-5个月前,斯坦福大学、百度和华盛顿大学的计算机科学教授詹姆斯·兰道证明了在手机上输入英语和普通话比用手机快三倍。去年,百度的语音识别产品同比增长约100%,现在是语音识别技术起飞的时候了。美国有几家公司做智能扬声器,用声音控制家用设备将很快普及。相关的操作系统和硬件将很快发布。
计算机视觉即将到来
中国的人脸识别发展迅速。因为在中国手机比笔记本电脑更受欢迎,所以很多人用手机代替了笔记本电脑。在中国,你只能通过手机申请助学贷款。这涉及到钱,所以你需要先核实你的身份和很多事情。这加速了人脸识别的发展。手机人脸识别作为一种基于生物特征的身份认证方法,在我国发展迅速。
在百度总部,认证不需要rfid卡,只要刷刷脸就可以直接进门。安德鲁·吴在youtube上有一段视频。如今,人们完全致力于人脸识别技术,并将其应用于安全性要求高的场景中。
百度在语音识别和计算机识别上投入了大量的资金和数据,这是任何一个小型开发团队都无法比拟的,也不太可能出现其他意想不到的技术突破。
人工智能在医疗卫生中的应用
安德鲁·吴对人工智能对医疗卫生领域的影响持乐观态度。今天许多放射科医生都受到人工智能的影响。在放射科工作四十年不是一个好的职业规划。
还有许多垂直领域会受到人工智能的影响,比如金融工程和教育。然而,它不太可能在短期内对教育产生实质性影响。
永恒的春天
从监督学习中,我们可以看到人工智能将如何逐渐改变各种行业。其他形式的人工智能,如无监督学习,强化学习,迁移学习等。,还处于研究阶段,而且目前的市场规模很小。
许多行业将经历几个冬天,然后迎来永恒的春天。艾经历了两个冬天,现在进入了永恒的春天。就像硅的春天一样,半导体、晶体管和计算周期都将随着人类发展很长一段时间。神经网络和深度学习将在很长一段时间内蓬勃发展,而一百年可能太遥远了,但一些重要应用改变几个主要行业的路线图是明确的。
人工智能确实正在取代人类的一些工作。当一些工作被人工智能取代时,我们需要一个新的教育系统来帮助那些失去工作的人获得新的技能。政府应该为那些愿意学习新技能,并再次成为工人一员的人提供基本的收入保障。我们需要新的系统和结构来帮助我们的社会发展成一个新世界。虽然会有新的工作类型,但工作消失的速度会比以前更快。
来源:搜狐微门户
标题:吴恩达说人工智能永恒的春天已经到来 你准备好了吗?
地址:http://www.shwmhw.com/shxw/58597.html