语音交互和手势交互在汽车上的发展与应用
北冥有鱼
|
2020.01.07
|
0
+关注

摘要:

传统汽车的人机交互以中控屏为核心,界面设计老旧,按钮和触屏的交互方式安全性较低,已经难以满足行车驾驶需求。汽车新四化的发展,让车辆的智能化有了新的着落点,智能驾驶座舱,即以多屏融合(液晶仪表+HUD+中控屏+后座娱乐)实现的交互体验,通过液晶仪表、HUD、中控屏及中控车载信息终端等载体,实现语音控制、手势操作等更智能化的交互方式,满足了用户行车驾驶的新需求,同时也提高了车辆的舒适性和安全性。本篇文章主要从语音交互和手势交互两方面,简要阐述了当前智能座舱概念在车辆上的发展与应用情况。

1. 术语

1.1 语音交互

语音是最自然的交互形态之一,有着输入效率高、门槛低、方便解放双手以及能有效进行情感交流的优势,智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。典型的应用场景—语音助手。如蔚来汽车的NOMI语音系统。

通过语音识别技术和文字转语音技术将语音声波转化成文字信息进行解析,之后再将解析生成好的内容转化文字信息传达给驾驶员,从而实现语音交互。麦克风阵列技术可以帮助语音识别系统在特殊的驾驶环境下降低特殊的噪音干扰,以提高语音识别的正确率。

1.2 手势交互

手势识别是通过数学算法来识别人类手势的一个议题。手势识别可以来自人的身体各部位的运动,但一般是指脸部和手的运动。用户可以使用简单的手势来控制或与设备交互,让计算机理解人类的行为。其核心技术为手势分割、手势分析以及手势识别。

2. 语音交互与手势交互的发展

从图灵提出人工智能这一概念开始,随着机器视觉和人工智能技术的不断发展,在双面识别的技术基础上,车内交互系统将整合人脸、手势、语音、物理按键、触摸虚拟按键等多中交互方式,提供多样化更加便捷和安全的人车交互方式。当前智能汽车的人机交互基本上涵盖八大场景:娱乐、社交、养护、生活、探索、健康、教育和办公。

2.1 语音交互方面的发展

2.1.1 多媒体娱乐方面

播放音乐或广播电台是车载智能语音常用的功能之一,尤其是在开车时,人们喜欢播放一些音乐节目或者听听交通广播。

2.1.2 车辆控制方面

基本功能包括车辆的启动、调整车窗,开关天窗、调整后视镜、开关车辆大灯、开关空调等。甚至于可以切换车辆的驾驶模式,通过语音交互系统,可以帮助驾驶者更加自如的掌控汽车,让驾驶者将注意力集中在汽车驾驶的任务上,从而提高驾驶汽车的安全性。

2.1.3 导航方面

导航方面可以为驾驶者提供目的地推荐和行程规划的服务。导航系统将整合工作单位,餐厅,商场,地点介绍、服务区、美甲、美发、游乐场所等地点推荐等等。自动为驾驶者安排行程规划供驾驶者参考。汽车将会为驾驶者量身定制生活规划服务,提供便捷与高效的生活方式。

2.1.4 驾驶行为监控方面

可以通过对驾驶者面部状态的识别而判断其精神状态,在适当的时候提醒驾驶者,以避免交通事故的发生。还可以对司机驾驶汽车的时长,驾驶行为表现等数据进行分析。如果发现驾驶者的驾驶时间过长,或是频繁出现压线行驶和紧急刹车等情况,及时的给予驾驶者语音提醒。

2.1.5 车况监控方面

驾驶者在驾驶过程中可以与汽车进行交谈并询问有关车辆状况的任何信息,如车轮的胎压,冷却剂和机油的水平等。实时的监控可以帮助驾驶者发现汽车的问题,并及时的作出恰当的处理,避免意外的发生。当汽车自己检测到问题时,也会主动以语音交互的形式提醒驾驶者。

2.2 手势交互方面的发展

手势交互是控制车辆信息娱乐系统的最新方式。传统交互以按键、旋钮等实体为主,最近几年,语音交互逐渐被载入车机系统。而手势交互作为其他交互的补充也在发挥着越来越重要的作用。

手势控制系统通过中控台上方的3D摄像头发出光线,根据光线发射与接受设备之间的时间差来分析出手势的变化。最终得到的数据会传递给车载系统的控制单元,由控制单元调出与识别出的手势相对应的功能,然后与系统中预设的手势匹配,下达相应的操作指令。

通过手势动作如左右挥手、空中轻点和横扫、手指画圈以及两个手指的平行或斜向拖曳的一系列动作,用户可以接听、拒听电话、控制音量,或进行翻页查询交互界面信息、缩放地图页面、转动摄像头视图、控制车辆(空调、座椅、窗户等)等功能,还包括主驾和副驾、后排乘客交互等多种场景。

宝马家族的7系、5系以及X7、X5、X3均带有手势识别功能,其中宝马7系是全球第一个装载手势识别的量产车型。它的手势识别区域为车机屏前方,供应商为德尔福,采用的是 TOF方案,可以识别7种预设手势,包括接挂电话、选择歌曲、调节音量、控制导航等功能。

众泰的君马 SEEK5。可以识别 9 种动作,包括接挂电话、选择歌曲、调节音量以及一个小彩蛋:握拳手心向上打开变为手掌,界面会出现玫瑰花。

拜腾的车型采用了48寸的大屏。由于屏幕巨大,手势控制也作为其中必不可少的交互方式之一。它的供应商是国内的凌感科技,采用的是双目立体成像方案,可以识别 5 种手势。

3. 语音交互与手势交互的应用

智能语音与手势交互属于智能驾舱概念范畴,其产品形态分为三个部分:汽车厂和汽车制造商,将先进的技术应用到汽车的驾驶舱中。科技巨头,为驾驶场景提供最尖端的语音交互解决方案和人工智能服务。创业公司,开发各种智能驾驶相关的便携硬件和软件服务。其中传统车厂通过内置智能系统改善驾驶舱内的驾驶体验;科技巨头通过提供平台的解决方案来实现;创业公司主要通过后装市场,将外部硬件与汽车连接,在通过软件服务来优化汽车驾驶舱的性能,将普通汽车变成智能汽车。

3.1 科大讯飞汽车智能交互系统

飞鱼A.I.套件是面向前装车厂定制的基于多平台的软件产品,采用云+端的技术架构,输出的语音核心能力涵盖麦克风阵列降噪、多语种识别、AIUI对话交互、多语种合成、生物识别等领域,具有自主学习,持续进化,个性化定制等特性。

在产品落地方面,搭载飞鱼系统2.0的广汽GS8,通过语音流畅地控制空调温度、车窗开闭以及语音导航、音乐、资讯等功能。科大讯飞为飞鱼系统开发出了免唤醒和长时交互技术,让用户的每次沟通无需再打招呼。此外,飞鱼2.0系统还提供基于长时记忆的上下文语音交互功能。

3.2 斑马系统

驾驶员只要喊一声“你好,斑马”,就能唤醒还在沉睡中的斑马系统,也可以直接通过按下方向盘上的语音键进行。斑马系统语音可以实现:天气查询,开启导航,空调开启/关闭,空调循环模式切换,风速调整,调亮/暗屏幕,打开/关闭蓝牙音乐/电台。除此之外,还可以执行车辆控制方面的指令:打开/关闭雨刮,打开/关闭天窗,打开/关闭车窗。斑马系统的语音识别功能在技术上的革新,让车主的右手得到进一步的释放。搭载斑马系统的主要车型如下所示。

3.3 GKUI吉客智能生态系统

GKUI系统主要搭载在吉利品牌的博越、缤越、缤瑞等车型上,同时也搭载于领克02、领克03、宝腾X70等车型上,该系统主要通过语音控制、触屏、手势控制以及物理按键等方式实现交互,其中语音功能在新版本中变得更加实用。语音助手通过“打断”和“复杂多条件搜索”技术,减轻了以往语音控制效率低的痛点。首先,“打断”技术可以让用户无须听完语音助手的回答就能继续下一个指令,效率大大提高;其次,“复杂多条件搜索”,可以上下文衔接,让多轮对话成为现实。

3.4 蔚来NOMI人工智能系统

蔚来NOMI集成语音交互系统和智能情感引擎,涵盖汽车导航、音乐、笑话、坐椅按摩、取名等情景,还可以控制车玻璃升降,天窗开合之类,也能分析语义,比如 “我有点冷”, NOMI就会自动调高车内温度。

3.5 DuerOS系统

DuerOS是百度全球领先人工智能技术的重要应用之一,借助百度的信息与服务构成的巨大生态,DuerOS拥有海量数据,能通过自然语言完成对硬件的操作与对话交流,DuerOS通过云端大脑时刻进行自动学习让机器具备人类的语言能力。DuerOS对话式人工智能系统,建立在语音识别、图像识别、自然语言处理、用户画像等世界领先的技术能力之上,是百度技术的集大成者。搭载DuerOS的设备可让用户以自然语言对话的交互方式,实现影音娱乐、信息查询、生活服务、出行路况等10大类目的200多项功能的操作。同时,借助云端大脑,DuerOS可以不断学习进化,变得越来越“聪明”。

DuerOS系统着重为用户提供4大类功能:

1)导航路况:通过语音交互实现导航查询,实时定位、周边查询、路况查询等功能。

2)娱乐资讯:通过语音交互进行音乐播放、点歌、切换FM、获取有声新闻等功能。

3)信息查询:通过语音交互实现接打电话、限号提醒、天气查询、航班查询、预约闹钟提醒等。

4)整车控制:通过语音交互调整车内空调、开关车灯、升降车窗、调整座位位置,查询车内状况等功能。

当前搭载该系统的车型主要有东风悦达起亚的福瑞迪、北汽新能源EX3/EX5等车型。

3.6 ClearVoice系统

Bose推出的ClearVoice技术通过音频信号处理软件与麦克风阵列等硬件的结合,实现了对车内背景音的降噪处理,将原本的通话语音还原出来,在使用汽车音响听音乐过程中,也能准确识别用户指令,完全不受背景杂音影响,大幅提高虚拟助手识别语音指令的准确率。有了ClearVoice,切换音乐、询问天气、记录日程、搜索导航等等功能,只需语音指令就可以完成,即便是打汽车电话,也能自动拾取人声消除背景杂音。目前在项技术已经搭载在全新一代保时捷Panamera 车型部分精选的Bose汽车音响系统中,红旗E-HS3是首个应用Bose Personal Plus音响系统的国产车型。

3.7 亚马逊Alexa

亚马逊Alexa,可以实现远程查看车辆剩余油量、远程启动车辆等功能,还可通过手机App连接车辆音响系统,以及通过内置Alexa配件对车辆进行语音操控。 2018年奥迪在发布e-tron纯电动车型时,就在车辆中内置了Alexa。其它汽车制造如丰田汽车,拜腾汽车等也与亚马逊进行合作、在车内整合Alexa。

驾驶员在使用Alexa时,除了能通过语音控制实现播放音乐、查询天气预报等基本功能外,还能和智能家居进行交互。例如把家里的灯关掉或是打开车库门;在路上行驶时,让Alexa自动寻找路边的商家;在家中或其他地方,车主还可以用Alexa远程启动车辆或上锁车门,检查燃油和胎压等。

3.8 Google Assistant

Google Assistant功能将逐渐被推广到车载系统Android Auto上。目前搭载Android Auto的车型有400多种,它们来自福特、通用、尼桑、大众和沃尔沃的40多个品牌;未来这些汽车将能够通过Google Assistant来听音乐、查路线,也能够与用户的手机屏幕实现联动等。该功能已经在宝马、沃尔沃XC40、梅赛德斯-奔驰和现代车型上推出。

3.9 CarPlay

车载CarPlay能够在驾驶车辆时智能、安全地使用 iPhone。全新的 CarPlay车载仪表盘可协助收听音乐或节目、使用导航、获取Siri建议,日历app能浏览和管理全天行程,还有地图app可将周边信息呈现眼前。车载CarPlay不但配备了专为驾驶场景而设计的Siri语音控制功能,车载CarPlay还可与旋钮、按钮或触屏等汽车控制装置配合使用。另外,app本身的设计也经过重新构思,让你开车时无需移开视线和双手就能使用。当前搭载CarPlay的车型主要有沃尔沃XC90、奔驰GLA、奥迪Q7、雪佛兰迈锐宝XL、全新君越等车型。

3.10 SoundHound

现代与SoundHound联手开发智能个人助理(IPA),这是一个用语音操控的人工智能助理,它的目标是在你驾驶车辆的时候帮你完成所有事情。这个IPA是一个主动助理,意味着它能够预测你的需求,将你所需的相关信息主动推送给你。IPA可以完成一些简单的任务,例如查询天气信息、发送短息、拨打电话、控制车门、设定导航目的地、管理事项安排以及搜索/播放音乐,在驾驶时无需分神。当前搭载该系统的车型包括奔驰A级车、现代和起亚部分车型。

3.11 车载智能硬件

汽车智能后视镜CoDriver,它整合了百度地图导航、智能管车、远程监控、辅助驾驶等功能。唤醒后可以进行导航、音乐、电话等功能的语音操作。基本实现自然语音交互,不需要完全按照规定的指令操作。

4. 总结

目前的汽车语音交互和手势交互还处于萌芽状态,虽然手势控制能实现的功能不少,甚至和语音交互的功能还有一定重复。但是手势和语音的关系绝不是非此即彼,是相辅相成的。未来人机交互一定是多维度的,多模态交互才是未来的发展趋势。在未来,手势识别、语音识别以及人脸识别等技术一道,将更好的应用于汽车交互,成为未来车内自然交互方式中的重要组成部分。

精选留言
延伸阅读
更多报告干货
写留言
3353
阅读
收藏
回到顶部