本篇文章3024字,读完约8分钟

雷锋的人工智能科技评论是根据2017年谷歌北美、欧洲和中东博士生奖学金名单发布的。该项目成立于2009年,旨在表彰在计算机科学领域表现出色的博士生。几天前,雷锋的《人工智能技术评论》与徐海峰进行了交流,徐海峰是获得这一荣誉的七名中国学生之一,也是南加州大学的博士生。

徐海峰于2012年毕业于中国科技大学专科学校(华班)。在加拿大滑铁卢大学学习计算数学后,他于2013年前往南加州大学攻读博士学位,师从shaddin dughmi和milind tambe。他的主要研究领域是算法博弈论、信息经济和算法设计与分析。

得知自己获得了谷歌博士奖学金后,许海峰在他的朋友圈里分享了这个好消息:“成就了我的一天。”

徐海峰获得了谷歌“算法、优化和营销”领域的博士奖学金,获得该领域奖学金的另外两位获奖者分别是加州大学伯克利分校和哈佛大学。赢得这一荣誉的背后是严格的评估过程和激烈的竞争过程。奖学金要求博士生导师向学校推荐他们,每个学校只能选择两名博士生,并代表候选人向谷歌提交申请。材料包括候选人的博士论文提案、简历和三封推荐信。根据徐海峰收到的邮件,谷歌已经成立了一个由研究科学家组成的专家评审团进行评估。

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

2017年,33名优秀博士生被谷歌北美、欧洲和中东博士生奖学金评选。作为七名中国获奖学生之一,许海峰打趣道:“他终于可以为老板省点钱了”,但他也感到很幸运。“特别感谢所有帮助过我的人,尤其是我的导师。ゥ

徐海峰为什么对算法博弈论如此着迷,可以追溯到他的大学经历。徐海峰,中国科学技术大学初级学院(华班)数学系学生,大四期间在微软亚洲研究院博士课题组实习。在高斌老师的指导下,他第一次接触到算法博弈论,并被它深深吸引。“当时,我认为这是一个数学、计算机和经济学完美结合的领域,具有理论和实际应用价值,这正是我想做的。ゥ

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

在积累了一年的计算数学基础后,徐海峰能够在自己喜欢的领域攻读博士学位。在回顾这门课程时,他还向刘铁燕老师、高斌老师和所有的研究人员表示了感谢。

许海峰博士的项目是从计算的角度研究信息的战略作用,这是近年来算法博弈论的一个热门研究方向。目前,许海峰不仅专注于此类问题的理论基础研究,还在导师米林·塔姆贝领导的团队核心小组开展应用型科研工作。接受雷Feng.com采访的南洋理工大学的安波博士(公开号:雷锋网)也是这个小组的成员。从官方网站上可以了解到,这个群体的研究主题是利用人工智能做社会公益。许海峰告诉雷锋。虽然团队成员有不同的背景,涵盖数学、物理、经济学、软件工程等专业,但他认为不同学科的思维模式交流有助于他们自己的研究。“该小组已经实现的应用包括优化美国联邦空警察的战略部署、优化美国海军警卫队的巡逻路线以及设计马来西亚自然保护区森林警卫队的巡逻路线等。ゥ

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

近年来,关于信息在游戏中的战略作用的研究引起了许多著名经济学家和计算机科学家的关注。例如,2014年获得卡拉克奖的斯坦福大学经济学教授马修·根茨科(matthew gentzkow)近年来发表了几篇相关论文(雷锋。卡拉克奖每两年颁发一次,授予对经济思想和理论做出最重要贡献的40岁以下的美国经济学家。大多数获奖者在获得这个奖项后都获得了诺贝尔经济学奖,所以他们也有“小诺贝尔经济学奖”的美誉。对于互联网巨头来说,信息的战略意义也是一个值得关注的问题。

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

像facebook和谷歌这样的大公司拥有大量受大数据时代驱动的信息,但如何战略性地利用这些信息来实现收入最大化涉及到公司、同行和客户(如广告商)之间的博弈。“大多数时候,最优信息策略需要计算,所以人们需要从计算的角度来研究信息的战略作用。例如,谷歌对每个互联网用户的描述有成千上万个特征。这些特性中的哪一个可以通过向广告商提供它们而使收入最大化?有超过21,000种特征组合可供选择,这比人类细胞要多得多。要从这么多选择中选出最好的,我们只能求助于优化算法。许海峰告诉雷锋。去年他在谷歌实习时,他的主要研究课题是谷歌和广告商之间的游戏。

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

但在设计算法时,许海峰提到主要有两个困难。

首先,很难分析系统。在信息不对称的情况下,很难分析游戏参与者的行为,更不用说根据他们的行为来计算最优信息策略了。

其次,信息不对称对游戏结果有影响。不同的游戏玩家有不同的信息,信息策略设计者也需要考虑参与者所拥有的信息对游戏的影响。

博弈论的算法设计和研究都是基于完全理性参与者的假设,但实际上完全理性的个体很少。这样,算法博弈理论会沦为“空的城堡”吗?许海峰表示,这个问题确实存在,有时模型不能完全描述实际情况。为了弥合这一差距,有两种解决办法。“一是塑造人的理性。另一种方法是进行稳健优化,使结果适合不同理性程度的参与者。ゥ

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

事实上,博弈论的决策权衡非常类似于机器学习最终面临真实问题的情况。如前所述,游戏参与者不太可能意识到“绝对理性”,并且由于复杂多变的现实,可能很难用公式直接描述它。这样,使用机器学习模型来描述游戏参与者的行为是合乎逻辑的。“所以不同的参与者可以被视为不同的机器学习模型,而游戏变成了机器学习模型之间的游戏。如果我们能够量化谈判者的衡量标准,用机器人代替人来谈判是完全可能的。在未来,许多新的行业,如自动商务谈判和自动公司决策可能会诞生。ゥ

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

反过来,博弈论也影响机器学习模型的设计。例如,gans是基于零和游戏。生成器模型希望通过制造假内容来“欺骗”鉴别器,并且鉴别器还需要不断提高其辨别假图像和真实图像的判断能力。

许海峰透露,目前,微软亚洲研究院刘铁燕博士的团队已经将博弈论和机器学习相结合进行了研究,利用机器学习来学习广告主的行为,然后根据学习到的模型设计最优机制。teamcore小组也有相关的研究工作,主要工作是用机器学习模型来描述对手在安全博弈中的策略,然后用博弈论来进行决策。

在算法博弈论逐渐成为一个新的研究领域的同时,在企业和大学都做过研究的许海峰也受到了机器学习热潮的触动。“在企业里做研究的一个好处是可以直接看到有实际应用价值的问题,而在学校里,往往需要自己想出一个有价值的课题。学校的一个优势是他们可以用更长的周期做一些研究,而企业通常需要出于各种考虑(如时间和经济成本)的直接和可行的解决方案。ゥ

谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

作为一名仍在学术界做研究的学生,许海峰觉得学术界和时尚界很相似。"许多人追随时尚潮流,许多人坚持自己的风格."他通常关注学术界的热门话题,并认为他的研究将是有益的。但无论如何,“我认为做自己喜欢的有价值的事情是件好事。”ゥ

徐海峰的论文正是带着解决问题的心态获得了去年的美国最佳学生作品奖;他的论文《安全游戏的算法设计》也入选了2016年的ec,并获得了secmas研讨会的最佳论文。

然而,许海峰在谈到获奖经验时,很谦虚地说,这是一个“仁者见仁,智者见智”的问题。“我认为最好的报纸是可以满足的,但不是寻求的,很难说有一个标准。他还向他提到了老师的教诲。”我的老师告诉我要努力解决最基本的问题,并为这些问题提供最自然、最完整的解决方案。至于结果,我只能让别人来判断。ゥ

也许这种研究思路使得许海峰获得谷歌博士奖是合理的。“能够学习我最喜欢的科目并获得认可,对我来说是一个很好的鼓励。他还让我们知道,成功之神的青睐不是偶然的,而是更加审慎和适度的努力。雷锋。com还将继续关注徐海峰的动态,见证他对算法博弈理论的精彩研究。

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

来源:搜狐微门户

标题:谷歌PhD奖研金获得者徐海峰:“幸运”的算法博弈论之路

地址:http://www.shwmhw.com/shxw/59989.html