本篇文章737字,读完约2分钟
[TechWeb]最近5月28日,ai主播出现在京东数字产业的ai公开课上,这是京东数字产业自主开发的ai虚拟数字人产品首次出现在公众面前。据报道,京东数字科学部将2d和3d技术相结合,将传统方法与深度学习相结合,只需要几分钟的人物视频数据。经过几个小时的训练,人工智能虚拟现实风格的数字人可以合成。
据悉,为了顺利实现从文本到语音的转换,JD.com开发了一种轻量级的反语音合成技术,结合深层神经网络对多人数据进行个性化建模,从而实现音色丰富、特征鲜明的语音合成效果,甚至模拟人的呼吸和停顿,听起来像真人。高效轻巧的反神经网络大大提高了合成速度,合成一秒钟的音频只需0.07秒,合成延迟仅为行业水平的三分之一,完全支持多场景实时语音合成。
在语音生成视频阶段,为了使ai主播的形象更加逼真,京东数字科学ai实验室采用对抗生成网络还原更加逼真的表情,并采用3d模型运动跟踪技术,保证ai主播说话时口型准确、表情细腻、头部运动自然。京东数字人工智能实验室利用大量的语音数据,特别设计了稳健的语音特征,可以由不同音色、语言和语速的合成语音驱动,并能保持准确连贯的口型,从而达到完美的嘴型匹配效果。
最后,JD.com开发了一个人工智能虚拟数字人与现实生活中的图像高度恢复。在人工智能算法的驱动下,小妮可以根据语义进行实时主持,她的表情、动作和声音都非常自然、逼真。
京东数字科学人工智能实验室首席科学家薄烈峰表示:人工智能主持人小妮的推出,是京东数字科学在多模态人工智能技术领域的成功应用。除了在客户服务和招聘方面的应用外,我们还将为内容创作者服务,通过人工智能虚拟数字人技术,将静态的图形内容转化为真人讲解的短片,以满足用户多样化的展示形式需求,增强用户的粘性和社区活动。
来源:搜狐微门户
标题:京东数科AI主播上岗 可用于招聘、客服等多场景
地址:http://www.shwmhw.com/shxw/8510.html