本篇文章1765字,读完约4分钟
6月6日至8日,在第23届圣彼得堡国际经济论坛上,新华社、俄罗斯塔斯社和搜狗公司联合推出了世界上第一个俄罗斯人工智能合成锚,将用于塔斯社未来的新闻报道。塔斯社是俄罗斯的国家通讯社。作为世界五大新闻机构之一,它向115个国家和地区提供新闻信息,在世界上有着广泛的影响力。
事实上,这不是搜狗人工智能主持人在重量级场合的样子。在2018年互联网大会期间,由搜狗和新华社联合发布的世界上第一个人工智能合成锚首次亮相,引起了全球传媒业和人工智能领域的极大关注。
搜狗人工智能合成锚多次代表中国的人工智能技术展,这是搜狗在人工智能方面的深度沉淀和对人工智能特别是智能语音的长期研发投入的结果。在人工智能应用领域,搜狗取得了全面突破。
中国人工智能征服世界舞台
三方共同推动的世界首个俄罗斯人工智能合成锚项目,将推动塔斯社在人机智能互动领域的建设,加快塔斯社在新闻传播领域的智能化进程。随着人工智能在俄罗斯每日新闻报道中的应用,人工智能合成主播在搜狗的概念将被更多人认可,人工智能合成主播的国际影响力将进一步扩大。
事实上,这不是搜狗第一次与世界知名媒体合作。早在2018年11月,搜狗和新华社联合推出了两个人工智能复合主播,一个中文,一个英文。据资料显示,两位人工智能主持人在任职6个月内共制作了5100多篇新闻报道,累计时间超过13000分钟,并在“两会”期间播出相关新闻,成绩突出。
同时,这不是搜狗的第一次国际合作。今年3月,搜狗赢得了阿联酋王室的热切关注,并与阿联酋阿布扎比媒体集团达成合作。双方将共同打造世界首个阿拉伯人工智能合成锚,并通过多项人工智能技术帮助阿联酋实现智能媒体升级。
人工智能合成锚技术的快速迭代和多语言的不断丰富离不开“搜狗阿凡达”技术的支持。随着“搜狗阿凡达”技术的发展,人工智能合成锚对数据采集的需求越来越小。目前,一个人的所有音像资料都可以在一天之内收集到,只需几个小时的音像资料就可以形成生动的图像。
作为世界上第一个能够真正实现人工智能现实生活图像模型构建的人工智能技术,《搜狗阿凡达》诞生于搜狗“自然交互+知识计算”的人工智能理念下,是搜狗人工智能的核心技术之一,也是人工智能合成锚的基础。
通过收集和学习真人的声音、嘴唇动作和表情,并结合声音合成、表情合成、嘴唇合成等技术。,我们可以克隆与真人没有什么不同的人工智能头像,然后帮助人类提高信息表达和传输的效率。
超越“搜狗的阿凡达”的人工智能未来
在人工智能领域,语音一直是技术的“皇冠”。人工智能语音变声技术不是简单的变声技术。目前,搜狗是语音变声领域最困难的技术。通过在语音表征学习和迁移学习技术上取得重大突破,它可以将任何人的声调转变为特定人的声调。
近年来,以“自然交互+知识计算”为战略核心,搜狗一直致力于人工智能的探索。人工智能语音交互已经取得多项技术突破,搜狗推出了人工智能同声传译、人工智能语音转换等技术成果,有望引领行业发展。
然而,搜狗显然对此不满意。人工智能合成锚技术的诸多进步表明,搜狗蓝图中的“未来语音交互”不仅仅是一种枯燥的语音信号传输,而是通过与图像、视频等多种媒体形式的结合,努力为人机交互注入更加生动的质感。基于“搜狗阿凡达”技术的人工智能合成锚技术在市场上的应用就是这一理念的具体体现。
未来,结合搜狗基于知识计算的对话和问答等核心能力,阿凡达技术将被引入到更多行业的建设中,必将为娱乐、医疗、健康教育、法律、金融等领域的各种场景赋予更强大的功能,不断实现从科幻到现实的转变。
从外界来看,搜狗最初是一家以搜索引擎为核心业务的公司。2017年11月在纽约证券交易所上市后,王小川迅速向公众公布了搜狗未来的人工智能战略。
该策略由两部分组成。第一个是人机交互,它涉及到在感知和认知层面对语言的理解;其次,以语言为核心,围绕机器提高其阅读和推理能力称为知识计算。智能硬件、翻译、问答……近年来,搜狗将其布局集中在人工智能领域。在王小川看来,搜狗关注人工智能的初衷是为了使其更容易表达和获取信息。
“搜狗是当今中国toc领域语音识别的领先引擎。因为我们有中国领先的输入法,每天有超过6亿的语音识别请求,包括语音修改。其目的是以语言为核心,让人们通过感知更好地交流。”王小川强调了搜狗作为人工智能代言人的独特优势。
来源:搜狐微门户
标题:全球首个俄语AI合成主播开播 搜狗黑科技亮相俄罗斯
地址:http://www.shwmhw.com/shxw/36603.html