本篇文章4315字,读完约11分钟
《雷锋》的编辑。德州扑克人机大战是继围棋之后最受关注的人工智能应用之一,它所代表的博弈问题也成为学者们关注和讨论的话题。事实上,算法博弈理论在安全领域具有非常重要的指导意义。它提供了合适的数学模型,并借助有限的安全资源进行合理的分配和部署。出于这个原因,雷锋。(公开号码:雷锋。邀请新加坡南洋理工大学计算机科学与工程学院助理教授安波博士为我们展示算法博弈论的魅力。
安波,新加坡南洋理工大学计算机科学与工程学院助理教授,于2011年获得马萨诸塞大学阿姆赫斯特分校计算机科学博士学位。主要研究领域包括人工智能、多智能体系统、博弈论和优化。在人工智能领域的国际顶级会议aamas、ijcai、aaai、icaps和kdd,以及著名的学术期刊jaamas、aij和ieee transactions上发表了60多篇论文。
曾获2010年国际智能体与多智能体系统协会优秀博士论文奖、2011年美国海岸警卫队优秀作战奖、2012年国际智能体与多智能体系统年会最佳应用论文奖、2016年人工智能创新与应用会议创新应用论文奖、2012年美国作战研究与管理研究协会丹尼尔奖。曾应邀在2017年国际智能体与多智能体系统国际联席会议上发表早期职业生涯重点演讲他是《人工智能研究杂志》(JAIR)的编辑委员会成员和《自主代理和多代理系统杂志》(JAAMAS)的副总编辑。当选为国际代理和多代理系统协会理事会成员。
雷锋。最近,关于德州扑克的人机大战非常激烈。你能告诉我们解决这种游戏问题的挑战吗?
安博士:德波的人机大战是继阿尔法戈围棋大战之后最热门的话题,特别是最近,李开复老师组织了卡内基梅隆大学天平系统与海南龙之队的对抗。毫不奇怪,人类棋手再次被天平动系统击垮。tuomas sandholm教授,天平动系统之父,是我的兄弟,也是我的学术偶像。天平动的成功与近年来最热门的深度学习无关,它的成功完全归功于德国-德国博弈问题的均衡策略的解决。这是最令人兴奋的。围棋游戏本身是一个完整的信息游戏,而扑克是一个不完整的信息游戏(玩家无法观察到对手的牌),所以它比完整的信息游戏更难解决。天平动系统基于一些关键技术,包括博弈抽象和逆映射、基于cfr的均衡解和剩余解。天平动目前的成功并不是终点。例如,天平动目前只能一对一对抗,不能参加团体比赛。
雷锋。安博士,你最近的主要研究方向之一是算法博弈理论及其在安全领域的应用研究。你能告诉我们这个研究方向的研究现状吗?
安博士:保护关键的公共基础设施和目标,如机场、港口、历史遗迹、发电设施、政治家,甚至珍稀动物和自然资源,对国家安全机构来说都是一项极具挑战性的任务。有限的安全资源使得安全机构不可能在任何时候提供全面的安全保护。此外,安全部门的反对者(如恐怖分子和罪犯)可以通过观察发现安全机构保护策略的固定模式和弱点,进而选择最优的攻击策略。降低对手观察和检测能力的一种方法是随机派遣安全部门的保护行动,例如警察巡逻、行李检查、车辆检查和其他安全程序。然而,安全部门在调度有效的随机安全策略时面临许多困难,尤其是有限的安全资源不能无处不在或始终提供安全保护。安全领域资源分配的关键问题是如何找到有限安全资源的最优分配方案,从而获得最佳的安全保护方案。
博弈论提供了一个合适的数学模型来研究有限安全资源的部署,从而使资源分配的有效性最大化。安全博弈论的研究是由南加州大学的米林德·坦贝教授领导的团队核心研究小组领导和发展的。现在越来越多的学者参与这项研究,包括卡内基梅隆大学、杜克大学、牛津大学等。相关论文已在人工智能领域的顶级会议aamas、aaai和ijcai上广泛发表。安全博弈论的研究已经成为人工智能研究的热点之一。基于安全博弈理论的系统已经被美国不同领域的安全机构所应用,包括机场安全、空警察派遣、海岸警卫队巡逻派遣和野生动物保护,产生了巨大的反响。例如,相关的研究成果和应用在美国国会听证会上被多次提及。
雷科技评论:在整个研究过程中最具挑战性的地方在哪里?如何解决?
安博士:安全博弈论的研究目的是解决实际的重大安全问题,这些问题通常非常复杂、规模大、不确定因素多。此外,安全领域的用户有解决方案质量的保证,所以启发式算法如遗传算法不能应用。
算法设计的第一个挑战是解决大规模的游戏问题。随着安全政策、恐怖袭击和安全部门安全资源数量的增加,空守卫者和攻击者的策略都呈指数级增长。传统算法无法解决如此大规模的安全游戏问题,因此提高现有安全游戏算法的可扩展性是一大挑战。
第二个主要挑战是算法的健壮性。传统的博弈论通常假设参与者是完全理性的,具有完美的记忆能力。但实际上,这些假设可能并不准确。因此,在计算防御者的资源分配策略时,算法应该考虑各种不确定性,包括效用误差、执行误差、观测误差和能力不确定性。
雷技术评论:事实上,算法博弈理论已经在很多安全领域得到了尝试和应用。例如,你参与的基于博弈论的美国海防巡逻计划的研究获得了2012年的丹尼尔·h·瓦格纳奖,该研究也得到应用。此外,您还有一篇关于野生动物保护的论文,并获得了iaai-16应用创新奖。你能简要介绍一下这项工作的难点吗,尤其是在算法设计和应用方面?我想知道基于博弈论的安全算法设计和美国海防巡逻应用之间是否有相同点和不同点。
安博士:每一个应用都会带来新的挑战。14日晚,马来西亚的合作非政府组织获得了动物保护区的巡逻路线,但他们无法执行我们制定的巡逻路线。2015年4月,我们专程去了马来西亚的动物保护区森林8个小时,却发现我们忽略了一些地理信息,使得巡逻人员无法完全按照我们制定的路线行进。后来,通过分析地理信息,我们找到了所有的山脊线,解决了最佳巡逻策略,并成功应用。最后,该算法还应用了攻击者建模和处理不确定信息的研究成果。
雷锋。com ai科技评论:从美国联邦空军事管理局,美国海岸警卫队到野生动物保护组织,将来有没有为这些专业领域设计的其他应用场景?如果加入博弈论的概念,是否有一个通用的安全系统,可以普遍应用于各种场景?
安博士:当前的安全博弈论研究可以应用到更多的安全领域,如网络安全、海上巡逻、边境巡逻、禁毒、打击犯罪、打击网络谣言等。现有的一些核心算法设计思想可以应用到新的应用领域,但是每个领域都可能有自己的特点,因此有必要分析新的应用领域的一些结构特征,并利用这些特征来提高算法的效率。
雷锋。《com ai科技评论》:在安全博弈论的研究中,有哪些问题亟待解决?通常需要什么样的数据来支持研究和应用?
安博士:很明显,新的应用领域将带来许多新的研究挑战,以前的应用也会有很大的改进。乔治·博克斯说所有的模型都是错的。现有的安全游戏模型是复杂安全领域的抽象,并且已经做出了许多简化和强有力的假设。(你能具体说明吗?未来的研究需要设计一个高保真的攻击者行为模型(如攻击者的理性行为选择),一个更合理的模型来描述环境和游戏问题的不确定性,以及游戏的时间空动态特性。
以往关于实体安全(尤其是反恐)的安全博弈理论的研究只能使用很少的数据,因此通常需要通过人工实验获得一些模拟数据。在珍稀动物保护和城市犯罪应用领域有很多数据,可以用来学习模型的一些参数。
雷技术评论:深度学习系统需要解决知识不完整的问题,系统需要考虑决策过程中非常复杂的情况。事实上,这与博弈论的概念非常相似。那么,结合你所做的一些工作,你认为人工智能如何才能更好地与博弈论相结合?
安博士:传统的人工智能技术通常考虑代理的设计。多智能体系统技术的出现使我们能够处理分布式学习、推理、规划、协调等问题。随着互联网技术的发展,多智能体系统中往往存在一些“自私”的智能体(如电子商务市场中的交易者),因此有必要引入博弈论来分析智能体的交互策略。这种“自私”的行为在我们的现实社会中随处可见。例如,司机会根据路况选择到达目的地的最佳路线,出租车会选择最佳运营时间以获得最大利润(这也是许多大城市出租车难以滑行的主要原因)。如果我们想用人工智能技术代替人类来做一些决定,我们需要用博弈论来分析复杂的相互作用,设计能够真正代替人类做出理性决定的代理。我们还在出租车市场和电动汽车充电站的配置方面做了最好的定价。
事实上,人工智能的先驱如冯.诺依曼和西蒙对博弈论做出了杰出的贡献。博弈论和人工智能实际上是基于决策理论的。例如,有一个著名的观点将人工智能定义为“智能体的研究和构建”。我国也有许多优秀的人工智能学者从事算法博弈论的研究,分布在msra、清华、上蔡等科研机构。
雷锋。《com ai技术评论》:有些人认为机器学习理论认为我们面临的问题可以转化为寻找优化解决方案的过程。那么你认为博弈论和机器学习优化之间的联系是什么?
安博士:对策论的研究已经转化为优化问题的求解,例如完全基于大规模优化算法的天平动系统的设计。机器学习与统计学结合得更紧密,而博弈论与运筹学结合得更紧密。
雷锋。技术评论:这个话题听起来不像人脸识别,语音识别,自然语言处理,它可以广泛应用于我们的生活。基于你的研究经验,你为什么选择算法博弈论的研究方向?
安博士:以前的应用更侧重于安全领域。目前,有许多研究试图将一些思想应用到包括网络安全在内的其他领域。当我在南加州大学做博士后研究员的时候,我开始在这个领域做研究,从那以后我一直在做。我很幸运能参与这项研究。这一系列研究最值得骄傲的是,我们不仅做了高质量的研究工作,而且有许多具有巨大影响力的实际应用。
雷科技评论:您将在今年的国际学术研讨会上做一个职业生涯早期聚焦演讲,介绍您近年来的研究工作。顺便说一下,请介绍一些你知道的其他流行的研究方向。
安博士:我可以介绍一下近年来博弈论在安全与可持续发展方面的研究进展。据我所知,在多智能体系统领域,流行的研究领域包括算法博弈论、多智能体学习、分布式规划、分布式优化等。
雷科技评论:人工智能目前在中国很热。根据你的教学经验和参与情况,你能和我们分享一下人工智能在新加坡(包括学术界/工业界)的发展吗?
安博士:人工智能在中国的流行主要是由工业驱动的。虽然新加坡的几所大学都有优秀的人工智能学者,但新加坡的行业对人工智能的热情不如中国。我听说新加坡政府最近正在制定一些大计划,我希望这些计划能真正促进人工智能的研究。
从德州扑克到安全领域,算法博弈论的魅力在于它可以在有限的资源下得到最大限度的优化和利用。基于算法的实用性,它也有着广泛的应用。我相信,在未来,不仅在安全领域,而且在更多的方向,算法博弈理论可以给人类带来便利。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
来源:搜狐微门户
标题:南洋理工大学安波博士:除了玩德扑 算法博弈论如何在安全领域大展拳脚?
地址:http://www.shwmhw.com/shxw/59738.html