车载语音群雄并起共争智能座舱新高地

  不论是苹果公司iOS系统中的智能语言助手“Siri” , 还是微软Windows系统中的“Cortana” , 智能语音交互早已融入我们生活之中 。随着汽车产业的发展 , 用户消费形态的改变 , 自动驾驶、智能座舱、新能源这些概念已经逐渐落地成为现实 , 智能语音交互与汽车之间也擦出了别样的火花 。
  由于驾驶汽车无法解放双手 , 对于人机互动的需求 , 则更多需要通过语言来实现 。因此 , 结合了人工智能的车载语音交互系统作为汽车智能网联时代的代表性产物 , 被更广泛地运用于汽车之中 。
  据盖世汽车研究院报告显示 , 随着消费者对座舱体验要求的提升 , 智能座舱将融合更多智能化、数字化功能 , 使得其单车价值量将大幅提升 , 2030年有望达到千亿规模 。车载语音交互系统作为智能座舱中不可或缺的一部分 , 是车内最直接、最人性化、最安全的交互方式 , 随着AI和硬件性能的增强 , 也将成为未来最主要的车内交互方式 。
  解决难点成行业首要共识
  智能语音交互主要有三大重点 , 分别是识别、理解、执行 。在目前提供解决方案的厂商中 , 识别部分已经趋于成熟 , 识别率可以达到90%以上 , 像是数据堂等公司的识别率已达95%左右 。行业的痛点主要聚焦于“理解”部分 , 大部分的车载语音交互系统在“理解”上并不智能 , 其主要体现在操作复杂与交互机械两个方面:
  现在大部分厂商提供的语音交互解决方案是通过触摸屏与部分语音相结合的方式进行交互 。同时在屏幕内的不同应用中还内置了不同的语音方案 , 这也带来了许多的操作不便 。
  此前传统主机厂提供的前端语音交互的功能 , 大部分采用命令控制 。用户需按照指定命令去进行交互 , 机器不具备语义理解能力 。交互机械化 , 导致整个系统功能单一、命令词单一 。
  此外 , 虽然语音识别准确率已经达到了一个较高的水平 , 但是用户毕竟是一个有独立精神的个体而非机器人 , “口误”随时可能发生 。因此在语音交互时 , 具有很大的不确定性 , 由于缺乏适应用户语音使用习惯的系统 , 以至于达不到正常的交互 , 无法完成用户设定的目标 。
  如何让车载语音交互系统像人一样理解我们的话语?这主要涉及到NLP(自然语言处理)技术 , 它们对于用户输入语音的理解与本身的场景策略、多轮对话有着密不可分的关系 , 并直接决定着车载语音交互系统的智能化程度 。
  如何交互 , 语音识别提供商献计献策
  目前谷歌在NLP技术中处于一枝独秀的地位 , 但在国内中文车载语音交互市场 , 科大讯飞、微软、数据堂、亚马逊、百度等公司都在云服务和NLP技术领域拥有不俗的实力 。
  科大讯飞作为汽车智能化领域的先行者 , 自2003年开始 , 深耕汽车智能化领域 , 使人工智能技术在汽车产品上得到了深度应用 。目前合作已覆盖90%以上的中国自主品牌和合资品牌车厂 , 累计前装搭载量突破 3600万套 。
  对于智能座舱提供了一整套解决方案 。以全链路的产品和服务合作为基础 , 让用户的体验和管理持续迭代、持续在线 。他们不仅仅停留于语音交互 , 还融入视觉和声纹多模感知交互等 , 让智能语音系统不再只服务于驾驶者 。此外 , 科大讯飞还在车载语音识别系统中加入了深度学习功能 , 致力于为汽车用户打造一个专属自己的虚拟人工助理 。值得一提的是 , 截止至2021年10月 , 科大讯飞共夺得38项国际人工智能大赛冠军 , 在人工智能领域建树颇多 。