车载语音识别“表现”不如千元手机 技术改进步履维艰

腾讯科技天宝11-22 09:52

近日,据《汽车新闻》网站报道,尽管语音识别技术被引入汽车领域已有数年时间,但即使到现在这项技术还是为各种各样的小问题所困扰。

Google Now(谷歌推出的即时应用)、苹果Siri以及微软Cortana已经为数以百万计的智能手机用提供过出色的服务,与此同时汽车制造企业却依然处在研发可靠且高效的语音识别系统的道路上。

 

车载语音识别“表现”不如千元手机 技术改进步履维艰

Nuance Communications公司在去年推出了专为宝马7系 再版车型研发的语音识别技术升级包

根据J.D.Power发布的《2016年美国新车质量调查》报告内容,在所有汽车买家所投诉的问题中,有23%的问题涉及汽车信息系统,而涉及语音识别系统的问题也占据了相当大的份额。负责美国汽车质量调查的副总裁瑞尼-史蒂芬斯(Renee Stephens)在接受记者采访时表示:“在我们看来,语音识别系统所引发的故障仍然是汽车消费者投诉首要问题。今年以来,汽车制造商在这一领域做出了一些改进,但行动进度仍比较缓慢。”

瑞尼-史蒂芬斯还指出,围绕语音识别系统所产生的投诉不仅仅来自于年纪较大的车主。事实上,在美国60后、70后以及千禧年和婴儿潮一代人中,车辆语音识别被称作是汽车最难使用的5大功能之一。

总部位于马萨诸塞州伯灵顿的Nuance Communications公司是汽车内置语音控制系统全球头号供应商,该公司表示如今车辆语音识别技术一直正在改进。Nuance Automotive公司总经理阿登-维尔(Arnd Weil)表示,宝马7系轿车上的语音识别功能可以看作是该项技术得以改进之后的典范。该公司在去年推出了专为宝马7系再版车型研发的语音识别技术升级包。

 

车载语音识别“表现”不如千元手机 技术改进步履维艰

Nuance Automotive公司总经理阿登-维尔

他介绍称,升级之后的语音识别软件可以理解车主发出的口语化指令,将车主的语音转化为短信息向外发送,车主甚至可以在系统执行命令过程中临时增加语音指令。尽管功能改善还存在不平衡的问题,但可靠性已经有所改善。比如,上述语音系统对电话号码的识别能力极高,其对语音拨号的识别准确度高达90%至95%。对于常规指令,如今的语音识别系统理解和执行的能力有所增强,但对于执行那些并不十分程式化的指令仍然有些生涩,比如按照车主要求寻找一些“有趣的地方”等。

早期的语音识别系统都依赖于数据库来执行语音指令,这些数据库中的数据比较简单,比如星巴克等连锁商店、埃克森加油站和希尔顿饭店等等的地理位置。新的车内语音识别系统则同云端服务器相连接,在准确理解语音指令的前提下,其可以在云服务器中找到任何的商业地点。

事实上在用户实际使用中会出现一系列的问题,比如一些饭店的外国名字本身就十分难理解,语音识别系统自然也就无能为力。另外一个问题在于当车内声音较为嘈杂时,语音识别系统的功能也会受到影响。比如在其他乘客在车内说话时,车主本人发出的语音指令就无法被系统准确识别。

为了解决上述问题,汽车制造商开始将车内麦克风由1个增加为2个,这就如同人类的两只耳朵。语音识别系统利用2个麦克风可以定位不同的说话人,由此便可更精准的识别出驾车人的声音。阿登-维尔表示这套新的语音识别系统被称之为“beam-forming”,其首次被应用于奥迪、梅赛德斯奔驰宝马车型中。眼下一些汽车业的大众品牌也开始使用这套系统。

在运用更为强大的电脑芯片之后,语音识别系统的功能还将得以进一步改进。由于云端连接无法保证一直有效,汽车制造商便利用电脑芯片推出一套语音识别后备系统并将其安装在车内。这套系统复杂程度不如云端语音识别系统,但其功能将一直持续获得改进。

尽管改进措施层出不穷,但车辆语音识别系统的表现还不太可能与一部200美元(约1000元人民币)的手机相媲美,因为车内声音嘈杂的情况不可避免,而驾车人必定会把更多注意力放在关注道路交通状况上。即使有Nuance这样的企业不懈努力,但J.D. Power提高对车辆语音系统评级还将会是一个缓慢的过程。