本篇文章1276字,读完约3分钟
最近,5月8日,谷歌翻译悄悄升级了它的翻译内核。根据谷歌提供的官方数据,谷歌翻译公司所携带的谷歌神经机器翻译(GNMT)系统采用了最先进的训练技术,从而提高了机器翻译的水平,翻译错误再次减少了55%-85%。
谷歌展示的翻译模型的质量
十多年前,谷歌发布了谷歌翻译。在早期,基于短语的统计机器翻译将输入句子分解成单词和短语,然后独立翻译它们。这种翻译方法的缺点是显而易见的:句子中原始的完整信息是支离破碎的,不能连贯地表达。这种现象在英汉翻译中尤为明显。
谷歌神经机器翻译将输入的句子作为一个整体进行翻译。
以汉英翻译为例,谷歌神经机器翻译首先将这个中文单词编码成一个向量列表,其中每个向量代表到目前为止读到的所有单词的含义(编码器)。读完整个句子后,解码器开始工作,一次生成一个英语句子单词(解码器)。
上图展示了谷歌神经机器翻译的汉英翻译原理
为了在每一步生成正确翻译的单词,解码器注意与英语单词的生成最相关的编码中文向量的权重分布。
当它第一次被提出时,神经机器翻译系统和基于短语的翻译系统在中等规模的数据集上是相当的。
现在,谷歌表示,通过让神经机器翻译克服了在非常大的数据集上工作的许多挑战,它已经创造了一个速度和准确性都更好的翻译系统。
目前,谷歌神经机器翻译系统已经投入到汉英翻译中。目前,谷歌翻译在手机版和网络版的中英文翻译已经完全采用神经机器翻译,每天约有1800万次翻译。
在谷歌神经机器翻译系统的支持下,该系统已经通过了大数据集的测试,最新的谷歌翻译效果如何?
我们做了一个简单的对比测试。当然,它还在汉英翻译的舞台上。
测试场景:电脑端谷歌翻译网页版
我随机选择了一条英文信息,原文如下:
自从covid-19问世以来,我们从我们的零售和品牌制造合作伙伴那里了解到,考虑到消费者需求的波动,他们渴望更多地了解消费者利益是如何变化的。我们看到这些变化反映在人们在谷歌上搜索的方式上。上个月,随着人们在家里呆的时间越来越长,对家庭用品和拼图玩具的搜索兴趣也激增。这个月,我们看到美国缝纫机和烘焙材料的兴趣激增,英国和澳大利亚的绳球套件和粉笔也在激增。
企业正在使用各种资源来了解不断变化的消费者兴趣,包括谷歌趋势、社交倾听、调查以及他们自己的数据,以便帮助他们在旅途中做出决策。但是如果他们不知道该寻找什么,就没有简单的方法来了解哪些产品类别越来越受欢迎,并可能带来机会。
这就是为什么我们在google上推出了一个新兴的零售分类工具。它展示了谷歌搜索中快速增长的、与产品相关的类别、它们增长的位置以及与之相关的查询。这是我们第一次就人们正在寻找的产品类别提供这种类型的见解。
英文翻译源于谷歌翻译的旧版本:
升级后的谷歌翻译给出了新的英文翻译结果,红色标记部分与旧的翻译结果不同。新的翻译如下:
比较这两段的翻译结果,我们可以看出差别相当大。总的来说,新的翻译结果中红色文字的表达明显更符合汉语语法和表达习惯。
此外,最后一段翻译结果的优化更加明显,谷歌产品名称与谷歌认为是准确识别,从而避免了随机翻译的尴尬。
它真的很聪明!
来源:搜狐微门户
标题:亲测|Google翻译内核升级:大型数据集神经机器翻译加持 称误差再降超55%
地址:http://www.shwmhw.com/shxw/8974.html