本篇文章526字,读完约1分钟
电子相册10月24日,一年一度的人工智能盛会——科大讯飞全球开发者节在安徽合肥召开。 在开发者现场,科大讯飞ai研究院常务副院长刘聪揭露了科大讯飞卫冕冠军背后的故事——独创的最新智能识别、合成和翻译技术。
科大讯飞在业界取得了一连串辉煌的成绩,仅今年就有许多比赛获胜。 6月,在icdar2019官方认证比赛中,科大讯飞一举获得线上和线下两项冠军。 8月,在国际语音合成大赛暴风雪比赛中,科大讯飞凭借独创的听觉量化编码框架和gan建模技术,创造了自然度得分4.5mos的历史新高,卫冕冠军。
科大讯飞ai研究院常务副院长刘聪介绍,在语音识别核心算法中,基于深度全序列卷积神经互联网( deep fully cnn ),科大讯飞创新开发出了高精度的记忆增强型多通道端到端语音识别技术。 通过分解语音输入、语音对话、语音记录三个典型的应用场景,继续实现语音识别的真正落地。 此外,基于语义分割和自适应感知领域的通用图像文字识别核心技术加快了ocr的本地化布局,以“云+端”的模式为客户提供了更好的产品体验。 另外,刘聪表示,融合行业知识的多通道半导演限制编解码翻译技术,提高专业术语和领域翻译的专业性,是科大讯飞通过catti专业测试的核心算法秘诀。
来源:搜狐微门户
标题:“让开发者创造越来越多可能! 1024开发者节揭秘科大讯飞核心技术特点”
地址:http://www.shwmhw.com/shxw/71625.html