本篇文章4112字,读完约10分钟
人工智能就像一个移动的目标,企业要做的就是尝试击中靶心。
当然,当我们看到alexa、siri和alphago不断占据头条时,我们不得不承认的另一个现实是,许多人工智能技术,包括机器学习和深度学习,仍然有许多局限性,需要我们投入巨大的精力和时间来克服。
因此,在今天的文章中,我们将全面讨论人工智能技术面临的障碍以及相应的解决方案。
根据麦肯锡全球研究所(McKinsey Global Institute)最近的研究报告(相关文章“McKinsey调查分析了全球160个案例,给出了5个行业的34个人工智能应用场景”),行业内的领先企业更倾向于投资和应用人工智能技术(图1)。
因此,为了增强企业未来的竞争力,我们必须有能力掌握更多足够的信息来处理人工智能问题。换句话说,我们不仅需要理解人工智能在促进创新、洞察和决策、促进收入增长甚至提高效率水平方面的现实意义,还需要深刻理解人工智能无法实现价值的领域。
挑战、局限与机遇:深度学习技术的视角
可以说,深度学习是目前人工智能领域最受关注的发展成果,它通过使用包含数百万个分层构造的模拟神经元的大型神经网络来帮助我们提高分类和预测的准确性。其中,最常见的网络称为卷积神经网络和递归神经网络。这些神经网络可以通过数据进行训练,并通过反向传播算法进行学习。
虽然这项技术已经取得了一系列的进展,但应该注意的是,最关键的步骤之一是如何将人工智能方法与问题和可用数据相匹配。因为这些系统是经过训练的,而不是经过编程的,所以它们的学习过程通常需要大量的标记数据来准确地执行复杂的任务。然而,通常很难获得大规模的数据集,即使能够实现,标注工作也需要大量的人力投入。
此外,我们很难判断深度学习训练中使用的数学模型如何达到特定的预测、推荐或决策要求。这就是黑盒问题。即使模型能够支持既定目标的实现,它的效用也可能是非常有限的。考虑到这一点,用户有时需要理解这背后的操作原理,以及为什么在某些情况下某些因素比其他因素更重要。然而,这并不容易。
基于此,我们在这里列举了人工智能技术及其应用的五个局限性,以及相应的解决方案:
-1-需要大量的数据标记
大多数现有的人工智能模型都是通过监督学习来训练的。这意味着人类必须对样本数据进行标记和分类,但是在这个过程中可能会有一些难以察觉的错误。强化学习和生成性对抗网络是解决这一问题的两种重要手段。
加强学习。强化学习是一种无监督的学习方法,它允许算法通过试错来完成学习任务。这有点像胡萝卜加大棒的简单训练方法:也就是说,算法在执行任务时每做一次尝试,如果其行为成功,就会得到奖励(比如更高的分数);如果不成功,它将受到惩罚。经过反复,学习环境能够准确反映现实,从而提高模型的效率。
目前,这种方法已经广泛应用于游戏领域,阿尔法戈就是一个典型的例子。此外,强化学习在商业领域也有很大的应用潜力。例如,通过构建一个人工智能驱动的交易组合,它可以学会在损益之间找到正确的交易规则;例如,建立一个产品推荐引擎,通过积分为销售活动提供决策建议;甚至以准时交货或降低油耗为奖励指标,开发运输路线选择软件等。
生成对抗网络。生成对抗网络是一种半监督学习方法。通过两套对立的神经网络,不断提高对同一概念的理解。以鸟类图像识别为例,一个网络负责正确区分鸟类图像,而另一个网络负责生成与鸟类非常相似的其他图像,以混淆前者。当这两个网络的性能最终稳定下来时,他们也对鸟类图像有了更准确的理解。
生成式对抗网络可以在一定程度上降低对数据集数量的要求。例如,当通过训练算法从医学图像中识别不同类型的肿瘤时,科学家们过去常常从人类标记的包含特定肿瘤类型或阶段的数百万幅图像中提取信息并创建数据集。然而,经过训练的生成对策网络可以通过绘制真实的肿瘤图像来训练肿瘤检测算法,然后将小的人类标记数据集与生成对策网络的输出结果相结合来快速完成学习。
-2-需要大量的数据集目前,机器学习技术要求训练数据集不仅要包含人工标注信息,而且要有大而全面的规模。深度学习还要求模型学习数千条数据记录,以便获得相对理想的分类能力;即使在某些情况下,为了达到与人类相似的判断准确度,也需要学习数百万条数据。例如,如果您想让自动驾驶车辆学习如何在各种天气条件下驾驶,您需要输入数据集中可能遇到的各种环境条件。
然而,在实际应用中,往往很难获得大量的数据集。为此,一次性学习是一种技术,它可以减少对大数据集的需求,并且可以通过仅使用几个现实的演示或示例(在某些情况下甚至是单个示例)来完成学习并快速掌握新技能。这样,人工智能的决策行为将更接近于人类的决策行为,也就是说,只需要一个单一的样本就能准确地识别同一类别的其他例子。
具体来说,数据科学家将在不断变化的虚拟环境中预先训练一套模型,这样他们就可以利用他们的知识顺利地找到正确的解决方案。一次性学习通常被认为是计算机视觉中的对象分类问题,旨在从一个或几个训练图像中学习对象类的信息,并已成功应用于包括计算机视觉和药物研发在内的高维数据领域。
-3-黑盒问题可解释性对于人工智能系统来说绝不是一个新问题。随着深度学习的逐步普及,其应用范围将不断扩大。但这也意味着更加多样化和尖端的应用通常会有更严重的不透明问题。
更大更复杂的模型使得人们很难解释为什么计算机会做出决定。然而,随着人工智能应用范围的扩大,监管者将对人工智能模型的可解释性做出严格的规定。
石灰法是在一组训练好的模型中,确定它在作出某一决策时更依赖的那部分输入数据,并用可解释的代理模型对其进行预测。在这种方法中,通过分析特定的数据段和观察预测结果的变化来微调模型,最终形成更准确的解释。
注意力技术是将模型考虑的最重要的输入数据可视化,并分析这部分数据和所做决策之间的关系。
此外,还有另一种方法:广义加法模型(gam)。线性模型简单、直观、易于理解。然而,在现实生活中,变量的作用通常不是线性的,线性假设可能不符合实际需要,甚至直接违背实际情况。广义可加模型是一种自由灵活的统计模型,可以用来检测非线性收益的影响。通过使用单一特征模型,它可以限制不同变量的相互作用,从而确保每个特征的输出可以更容易地解释。
通过这些方法,我们正在慢慢揭开人工智能决策的神秘面纱,这对扩大人工智能的应用范围具有重要的现实意义。
——4——学习模型的普遍性不同于人类的普遍性,所以人工智能模型很难从别人那里得出推论。因此,即使在高度相似的情况下,企业也必须投入资源多次培训新的模型,这意味着新的成本。
解决这一问题的有效方法之一是迁移学习。也就是说,一个领域(即源领域)中的知识被转移到另一个领域(即目标领域),使得目标领域能够获得更好的学习结果。在人工智能领域,人工智能模型被训练来完成一个任务,然后它被迅速转移到另一个相似但不同的任务环境。
随着迁移学习的逐渐成熟,它将帮助企业更快地构建新的应用程序,并为现有应用程序提供更多功能。
例如,在创建虚拟助手时,迁移学习可以将用户在某个领域(如音乐)的偏好扩展到其他领域(如书籍)。又如,迁移学习还可以帮助油气生产商扩大人工智能算法的训练规模,从而对管道、钻井平台等设备进行预测性维护。
另一种方法是使用可以应用于多个问题的通用架构。例如,deepmind设计了一套与阿尔法零中三个不同游戏相对应的架构模型。
-5-数据和算法中的偏差。如果输入数据与人们的偏好混在一起,或者有些数据被忽略,有些数据有偏差,那么算法结果可能会有偏差。在具体应用中,可能导致错误的招聘决策、不恰当的科学或医学预测、不合理的财务模型或刑事司法决策,甚至导致法律层面的滥用。然而,在大多数情况下,这些偏见往往难以察觉。
目前,该行业正在做大量的研究工作,以建立最佳做法,解决学术、非营利和私营部门面临的这一实际问题。
一个企业应该如何实现移动目标
要解决上面提到的这些限制,我们还有很长的路要走。然而,事实上,人工智能的最大局限可能在于我们的想象。下面,麦肯锡为那些想利用人工智能技术实现飞跃的商业领袖们提出了一些建议:
做你的家庭作业,关注你的目标,并随时跟进。虽然大多数管理人员不需要知道卷积神经网络和递归神经网络之间的区别,但是他们也应该对他们目前能够实现的功能有一个总体的了解,并且在把握他们短期发展的可能性的同时展望未来。
了解数据科学和机器学习专家提出的专业知识,并与人工智能先驱交流以弥补他们的不足。
采用精确的数据策略。人工智能算法需要人工的帮助和指导,因此企业可以提前制定全面的数据策略。该策略不仅要关注从不同系统中总结数据的技术,还要关注数据可用性、数据获取、标记、治理等任务。
如上所述,一些方法可以减少人工智能算法训练所需的数据量,但监督学习仍然是目前的主流。同时,减少对数据的需求并不意味着不需要数据。因此,对于一个企业来说,最重要的是理解和掌握自己的数据,并考虑如何使用它。
浏览数据,横向思考。迁移学习技术仍处于起步阶段。因此,如果您需要解决大型仓储系统的预测性维护问题,您能使用相同的解决方案来支持消费产品吗?面对多种销售渠道,适用于其中一种渠道的解决方案能否也适用于其他渠道?因此,为了使该算法能够从他人那里得到推论,还应该鼓励业务部门共享数据,这对于人工智能在未来的应用将具有重要意义。
主动成为先锋。当然,仅仅跟上当前的人工智能技术不足以维持企业的长期竞争优势。企业领导者需要鼓励他们的数据科学工作者或合作伙伴与外部专家合作,并使用新兴技术来解决应用程序问题。
此外,跟上技术的可行性和可用性。目前,各种机器学习工具、数据集和标准应用的训练模型(包括语音、视觉和情感检测)正在被广泛使用。随时关注和利用相关项目,将有效提升企业的先发优势。
在过去的两年里,虽然人工智能技术已经让人们兴奋不已,但事实上,其发展所需的技术、工具和流程还没有完全形成,研究人员正在积极解决各种最困难的实际问题。作为一个企业,现在应该做的是抓住时间去了解在人工智能的前沿正在发生什么,并在此基础上定位组织和学习理念,最终利用甚至促进它所带来的所有可能性。
来源:搜狐微门户
标题:麦肯锡:使用人工智能技术的五大障碍
地址:http://www.shwmhw.com/shxw/41109.html