本篇文章1774字,读完约4分钟
经济日报-中国经济网,北京,7月9日-作为全球学术界最权威的机器翻译大赛,最近,wmt2020国际机器翻译大赛名单停止提交结果并公布排名,其中腾讯微信ai团队在“汉英”翻译任务中获得冠军。
提交结果:博乐获得第一名,微信艾获得汉英翻译方向冠军
Wmt是机器翻译领域的顶级国际评估比赛之一。自2006年成立以来,wmt已成功举办了15届。每年的比赛都会吸引来自世界各地的企业、科研机构和大学的顶尖团队,包括微软、facebook、百度、金山和nict。
在竞赛系统中,组委会根据不同的翻译任务提供测试集,如汉英、英汉、汉日等。,参赛者在线提交机器翻译结果。组委会将根据国际公认的bleu自动评价指标对参赛者提交的机器翻译和标准答案进行拟合和计算,拟合度最高的排名第一。其中,“汉英”翻译任务是最具竞争力的领域,也是多年来竞争的最大亮点之一。在前几届冠军中,微软、腾讯翻译机君和都榜上有名。
竞争非常激烈,所有参与者提交了近300次数据。最后,微信人工智能团队在多次比赛后脱颖而出,成功占据自动测评指标榜首,并赢得桂冠。值得一提的是,bleu分数的前两个机器翻译是由微信人工智能团队提交的。同时,今年微信ai只使用了官方数据(即有限资源),超过了所有使用有限资源和无限资源的系统。
微信人工智能采用两种结构和三种培训方法,创造了领先的翻译技术
在世界上取得好的成绩和认可,离不开人工智能领域人工智能团队的不断培养和产品经验的不断完善。自2017年以来,基于业界最前沿的神经网络机器翻译技术,微信人工智能团队不断迭代、引入最前沿的机器翻译算法,并不断创新算法和架构,以提高翻译能力。
在本次大赛中,微信翻译基于更深更广的转换结构(包括自我关注和平均关注)和自主开发的深度过渡结构(dtmt),并通过整合领域知识的数据增强方法迭代生成高质量的伪数据。除了传统的交叉熵训练外,还采用了三种改进的训练方法来缓解偏差问题,包括改进的预定抽样训练方法、针对目标输入的抗噪声训练和更稳定的最小贝叶斯风险训练。
目前,微信翻译已经成为大规模的多语种机器翻译引擎,每天翻译数十亿个字符,支持多种语言之间的双向翻译,翻译质量达到行业领先水平。服务场景涵盖了微信对话翻译、朋友圈翻译、微信扫等。同时,他们还为腾讯肖伟、微信对话开放平台、微信阅读、qq邮箱等提供翻译服务支持。,并将陆续应用于更多场景。
(微信对话翻译场景)
基础研究和技术开源,微信继续深化人工智能
除了在智能翻译领域取得的突出成就外,微信人工智能团队在其他领域也取得了许多成就。不仅在2018年和2019年获得了dstc冠军,还在竞赛中获得了高考试题榜第一名、数学推理落榜第一名和2019年quac多轮互动推理榜第一名,凸显了微信ai团队在对话和推理方面的技术实力。
在自然语言处理领域的顶级会议acl 2019中,由中国科学院计算技术研究所和微信ai合作的文章“弥合神经机器翻译的训练和影响之间的差距”获得了最佳长论文奖,这也是中国大陆第一篇获得该奖项的文章。随后,在acl 2020中,微信人工智能团队选择了7篇论文,涵盖了机器翻译、信息抽取和对话系统领域的研究成果。在过去的两年里,微信人工智能团队的16篇论文入选了acl。
基于深度学习研发,微信凌志语音识别技术每天可处理4亿多个语音,语音识别准确率达97%,并为微信语音输入、语音转文本、王者荣耀、qq音乐等产品提供技术支持。微信智言专注于智能对话和自然语言处理,以腾讯的小微开放能力为核心,为除家庭硬件、paas、工业云和ai bot之外的其他领域提供技术支持,让人们能够以最自然、最便捷的方式与机器交流。
在技术开源方面,微信开发了变压器推理机,这是腾讯开源的第100个项目。推理引擎在cpu/gpu两种硬件平台上都可以达到最好的性能,比pytorch/tensorflow和当前主流的变压器加速方案更快,更适合nlp任务的特点,无需图级预处理,支持变长输入序列。在腾讯的内部领域,如游戏、内容生态、广告和金融,涡轮增压器已经得到了广泛的应用和认可。
未来,微信ai将继续加大在人工智能领域的学习和投入,积极将技术升级应用到产品中,创新整合新功能,基于微信平台生态带来更广的应用场景和更智能的产品体验,为12亿微信用户提供更好的智能服务。
来源:搜狐微门户
标题:微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名
地址:http://www.shwmhw.com/shxw/31565.html