本篇文章1931字,读完约5分钟

语音交互是去年人工智能最热门的领域,先锋智能扬声器的一个产品让所有互联网领导者都参与了这场战争。

然而,从引人注目的苹果siri语音助手到智能扬声器,语音这一极有望成为人机交互入口的技术,似乎未能形成一个真正颠覆市场的应用,而且一直处于火热状态。相反,视觉技术中的人脸识别已经形成了大规模的基础应用,已经渗透到金融、安全甚至零售领域。

为什么第一个火起来并寄予厚望的语音交互在市场应用中似乎很慢?

Spirent首席营销官龙告诉益邦电力网,一方面,与图像识别相比,交互式语音链更长,这是一个越来越深的点。语音交互不仅包括识别,还包括理解文本的含义并反馈,包括自然语言理解、语音合成和内容资源的综合挖掘。这条路线比图片的要长得多。

另一方面,机器视觉中的干扰因素很少。例如,人脸识别的面部特征在几十年内不会有很大的变化,光的强度已经被红外线解决了。声音是一个变量,在噪音、环境、距离和人的发音特征等因素下的声音交互是完全不同的。同一个句子的意思在不同的场景中是完全不同的,比如购物和办公室。

因此,言语比视觉更具挑战性,它只存在于整体智力中,而不是局部智力中。语音是一种交互手段,通过它可以检索后端服务,例如听什么歌和去哪里。这涉及到与后端内容的合作。如果第三方内容库的内容不完整,整个语音交互将不够智能。

第三,语音的商业化再现性不高,而图像识别技术的应用再现性很高,对设备的依赖性不高,因此数据包可以在任何情况下使用。

声音所在的场景是不同的。例如,它用于不同的产品,如机器人、冰箱和汽车。有可能对这三种产品说同一句话“我饿了”,也可能只是和机器人聊天;对于汽车来说,它肯定不是叫外卖或聊天,只有导航是可能的。

因此,没有办法将所有的语义整合到一个公共库中,并将其复制到所有的产品中。每个产品对于不同的场景有不同的需求,需要定制。

基于语音的特点,语音交互的商业化更像是一个系统工程,从语音识别到语义理解再到后端内容资源库,相互制约,影响全身。由于语音交互的复杂性所带来的商业化困境,Esprit等语音交互技术公司也开始走技术平台输出路线。

一方面,开放自己的基本技术能力,让市场化的应用企业在此基础上直接商业化。例如,智能语音服务在家庭、汽车、金融、医疗、教育等领域可以利用其平台技术探索细分。该领域的商业化,扩大了定制的规模;另一方面,语音交互技术的开辟扩大了生态合作,从而突破了语音交互的局限。

依邦电力网称,目前,Esprit的商业化包括汽车、物联网(智能扬声器、电视等)。),儿童故事机和平台。

其中,车内是Esprit的优势之一,其主要合作产品是车内后视镜、智能汽车机器和平视显示器。Esprit为硬件制造商提供语音交互功能,以及车内场景下的后端资源集成,如音乐和导航。小米70英里智能后视镜是Esprit提供的语音交互技术。

虽然车载行业是语音交互技术较早介入的领域,但经过两年的发展,2017年市场逐渐稳定。主要原因是汽车后视镜产品对股市来说是锦上添花,而不是用户买车的必备因素。从汽车公司的品牌端直接进入前置市场是一个漫长的过程。

另外,汽车后装市场比较复杂,90%的车载智能后视镜产品集中在深圳,没有品牌,通过汽车维修店和网络渠道,但没有真正进入4s店渠道,无法形成大规模的市场推广。然而,龙判断,目前汽车后视镜在后装市场似乎已经饱和,但一直在股市。如果你真的能开设4s店和其他渠道,它将带来真正的红利。

Esprit的物联网商业应用主要基于智能扬声器。小米的萧艾同学和天猫精灵由精灵提供语音交互解决方案。其中,天猫精灵采用了Spice的6环小麦阵列软硬件技术,包括前端信号采集、降噪、麦克风阵列、远场交互等。

据龙介绍,仅在2017年双十一期间,天猫Elf x1的销量就超过了100万,这使得Esprit在智能扬声器领域的品牌覆盖面位居行业第一。

儿童故事机是一个商业应用市场,刚刚在2017年开始流行。几乎所有语音技术第一梯队的公司,如Esprit和iFlytek,都将在2018年专注于这个市场。

“3-4岁的孩子对娱乐和教育有着强烈的需求,智能语音交互技术是对传统市场的升级。该产品的外观不限于故事机,也可以是平板或智能扬声器。这是一个纯粹需要的市场,这一代父母对新产品的接受度很高。”龙对说道。

在智能扬声器着火一段时间后的不明朗环境下,2018年,story machine已经成为一款对语音交互技术寄予厚望的市场化产品,承担着沉重的出货责任。

然而,儿童的互动不像成人那样有逻辑性,他们的发音也不像成人那样清晰,因此从技术上来说,识别儿童的发音能力是一个挑战。然而,在这种技术水平上,Esprit推出了一个优化的解决方案。

来源:搜狐微门户

标题:寄予厚望的语音交互遭遇商业化困局

地址:http://www.shwmhw.com/shxw/44993.html