早上7点,当你打开车门,坐到车里,忙碌的一天开始了。
车主:
今天天气怎么样?
车载助手:
根据最新天气预报,北京天气晴朗,温度在18到28摄氏度之间,非常适合出行。
车主:
帮我订一杯美式咖啡。
车载助手:
正在查找沿途咖啡店,已下单,为您导航前往。
车主:
今天有哪些议程?
车载助手:
今天安排的议程如下:上午9:00市场部团队开会,讨论新季度营销策略⋯⋯
车主:
帮我把邮件里的资料整理成PPT。
车载助手:
正在生成文件。
当然,车载助手的用途远不止这些,它还可以进行邮件阅读和回复、电话会议、会议纪要、车辆状态检查、交通信息提醒、音乐播放、开关空调/车窗等,这样的实用功能彻底解放了双手。在数字化浪潮中,物联网、云计算、大数据、人工智能等技术已渗透到汽车产业,汽车智能化发展速度日益加快,产业格局不断重构。
汽车智能化涉及多个方面,包括智能驾驶、智能座舱、智能网联、智能电动和车云服务,其中,智能驾驶和智能座舱更是成为汽车智能化转型的关注焦点,而车载助手是智能座舱的关键功能,引领智能座舱新风尚。
智能座舱是人车交互的第一入口,通过图像、语音、触控、手势等交互方式,满足用户对车载信息娱乐、导航、远程控制等多样化需求,现已成为中高端车辆标配。随着技术的进步,智能座舱从传统的触控交互时代,进入当前以语音为主的智能交互阶段。在智能座舱中,驾驶员通过语音指令即可完成各种操作,不仅提升了驾驶便捷性,更在安全性和用户体验方面带来革命性变化。语音交互细分为唤醒、聆听、理解、播报四个环节,即说出预设的唤醒词激活系统,当系统被唤醒后进行用户语音输入,将语音转换为机器可以理解的命令,当系统处理完用户指令后,再以语音形式回复用户。这个过程涉及诸多关键技术,如用于识别座舱中不同区域唤醒指令来源的声源定位技术,允许系统同时进行听和说操作的全双工语音交互技术,允许用户连续说出命令无需等待系统响应的One-Shot技术,将文本转化成拟人化语音的语音合成技术等。此外,还有可以集成在智能座舱显示系统中的数字人技术,通过语音和视觉反馈响应用户指令,进一步增强了用户体验。
打通全链路是构建语音交互能力的关键。随着人工智能技术的不断发展,语音交互技术也越来越成熟,广泛应用于智能汽车、智能家居、智能客服、智能医疗等领域。然而,实现高效、准确的语音交互仍然面临一系列挑战。语音交互是由多个技术节点组成的长调用链路,包括声学信号处理、语音识别与合成、性别/年龄/声纹识别、自然语言理解、知识图谱、对话管理、智能交互决策等技术,各个技术节点之间需要适配和总体协调优化,根据不同搭载终端和应用场景,又可延伸出各种技术方向。
“软硬一体化”成为主流选择。人工智能应用已经进入商业化快速落地阶段。智能语音交互技术的应用边界拓宽,物联网智能终端也突破场景限制,逐步扩展至各类传统服务场景,越来越多的企业倾向于直接采购整合型硬件产品,以满足综合体验好、立采即用、快速交付的需求,因在性能、集成、成本、端到端解决方案等方面存在优势,智能语音交互技术+芯片的软硬一体化方案成为必然趋势。
智能座舱呼唤车载级专属AI大模型。大模型时代,各家都在比拼模型大小,百亿、千亿级参数的大模型层出不穷,但都逃离不了ChatGPT的规则,即泛语言生成式大模型。不过,在智能座舱里,用户真正需要的是一个“极速、不打扰、按需提供可靠内容”的车载专属AI大模型。对此,2023年年底,思必驰首次提出一套定义,车载专属AI大模型=百亿规模模型+车载专属数据+车载专属动态可定制prompt+车载场景设计。
思必驰自主研发了全链路智能语音语言交互技术,基于全链路智能对话系统定制开发平台(DUI平台)、人工智能语音芯片、对话式语言大模型DFM,围绕“云+芯”进行布局,提供软硬一体化解决方案和全渠道智能对话服务,实现广泛的智能人机交互。近年来,思必驰以提升语音识别的准确性、交互的自然性及系统的智能化水平为目标,实现多项创新和突破,助力车企打造更加人性化的智能座舱,推动汽车智能化进程。
1. 软件方面
基于自研的全链路智能语音语言交互技术,思必驰为汽车前装、后装设备及两轮车提供语音技术SDK、天琴车载语音助手(国内版/海外版)及软硬一体化解决方案,满足主机厂、车厂及一级供应商对语音交互的需求,同时还提供场景化大数据运营服务能力,推进车联网智能化升级。思必驰天琴车载语音助手服务于汽车前装与后装导航及智能座舱设备,不仅具备全双工交互免唤醒、一句话多意图、可见即可说、上下文指代、声纹识别、多音区声源定位等功能,同时还具有高度定制性,客户可以根据实际需求在UI界面、唤醒词、合成音等方面进行个性化定制。
在中国泰尔实验室、中国信息通信研究院联合进行的可信 AI 评测中,思必驰天琴车载语音助手荣获智能车载语音交互产品L9 级别(九级智能)证书,这是目前国内车载语音助手领域的最高智能认证等级。在思必驰自研的对话式语言大模型DFM-2基础上,天琴语音助手可实现出行规划、情感关怀交互、多种风格人设、复杂任务定制等功能,并支持多模态、多意图、多音区、全场景多轮连续对话。
在出行规划方面,天琴语音助手打通旅游、导航、美食、加油、日程提醒等多源信息,串联200多家生态服务,能够为用户提供更智能的出行方案。基于汽车领域知识、大模型能力构建的“汽车大师”,不仅能为用户提供实时用车咨询,还可以适配用户场景,并执行指令动作,以及实现智能场景自定义。以大模型能力打造的虚拟情感助理,具备多人设、多情感交互能力,可以为用户提供个性化的情感陪伴,大模型还支持儿童模式、图/文生成等功能。
▲
思必驰的软硬一体化解决方案正在革新智能座舱体验,推动汽车行业智能化转型。
2.硬件方面
为进一步满足车企智能化需求,思必驰为市场存量汽车、新款经济型汽车提供智能仪表中控二合一、智能收放机、智能车载机器人、智能车载音箱、智能车载仪表、智能车载中控、HUD(抬头显示系统)、语音报警器、行车记录仪等终端硬件产品,经济型汽车通过思必驰智能硬件的加持即可实现语音交互,让用户享受路线导航、音乐播放、天气查询、美食搜索、养车咨询、趣味闲聊等出行服务。其中,面向前装市场推出的车载智能收放机,通过打造无屏版智能中控,围绕“云+管+端+手”四个维度创新,为整车提供智能化改造。这一解决方案以更低的成本实现了更多个性化特征和更高的性价比,一经推出便受到五菱、大通等多个品牌青睐。
智能仪表除了具备完善的仪表功能,显示车速、电量、系统功率、续航、里程、报警灯等信息,还具备离在线语音交互功能,用户通过语音指令即可查询车辆故障信息、进行空调/车窗等控制,现已应用于五菱、小康等多款车型。在HUD领域,思必驰推出了多款备受消费者喜爱的产品,以“HUD显示+语音操控”的形式为用户提供更多出行服务。
3.基于DFM-2大模型的规模化定制
企业的需求千人千面,且随业务发展不断变化,单靠通用产品难以满足需求,须针对不同客户群体、不同业务及发展阶段,为客户提供定制化服务。思必驰DUI平台是目前国内主流的可定制对话平台之一,集成了思必驰全链路智能语音语言交互技术,具备快速规模化、私有化部署、知识图谱迁移等能力,通过针对不同场景的定制,即可实现对话系统的柔性组合制造,快速转化为成熟产品。
过去几年,汽车座舱智能化进程取得显著突破,但车载语音系统底层仍然是没有完全成熟的任务型对话系统,无法真正实现个性化和情感化交互。直到2023年,大模型的火爆让业界看到了智能座舱的升级方向。
DFM-2大模型是思必驰推出的一款人工智能模型,核心优势体现在三个方面:
一是其通用智能能力,包括知识的理解和应用;
二是有效应对行业落地挑战的能力;
三是大模型与全链路对话技术的协同效应。
利用思必驰DFM-2大模型,DUI平台已成功升级至DUI 2.0版本,进一步解决了个性化定制的行业落地难题,大幅提高了AI语音交互技术规模化落地效率。
在思必驰DUI平台上,无需技术人员重度参与,开发者与用户即可进行从唤醒、识别、合成到语义理解、对话逻辑等的全链路对话系统定制开发,快速构建具备完整功能的、软硬件融合的场景化人机对话系统,使汽车成为居住和工作空间外的第三空间。思必驰大模型在智能座舱的应用案例成功入选由中国质量认证中心和中关村智用人工智能研究院联合发布的《大模型行业应用白皮书》。作为参编单位之一,思必驰与中国信通院合作,共同完成了《面向行业的大规模预训练模型技术和应用评估方法 第4部分:汽车》这一国内首个针对汽车行业的大模型标准。
随着语音技术渗透率不断提升,用户对于语音交互的智能化要求也在不断提高,不再满足于简单的语音操控,而是寻求更符合驾驶场景的人机交互模式,连续识别、分区唤醒、可见即可说、声纹识别等语音交互相关功能的搭载率明显提升。在全球汽车产业向电动化、智能化转型关键时期,国内外车企与中国科技企业跨界合作日益频繁,在思必驰的客户群中,不仅有梅赛德斯―奔驰、奥迪、保时捷等国外高端汽车品牌,还有比亚迪、长城汽车、北汽、吉利汽车、上汽、哪吒汽车、理想汽车等国内知名企业。
随着我国新能源乘用车渗透率突破50%,汽车行业迎来历史拐点,目前,70%的中国新能源汽车制造商采用了思必驰的语音交互技术。智能语音交互功能正在实现规模化普及和应用。
作者单位 思必驰智能汽车事业部