GPT上车只为人车交互？车企还在憋大招

站长网2023-07-04 11:14:350阅

ChatGPT改造汽车的序幕已经拉开，奔驰率先出手。

不久前，梅赛德斯-奔驰将ChatGPT集成到了车机上，开启了为期三个月的测试，结果显示，它的语音助手不仅可以完成简单地指令，还能进行连续多轮对话，理解能力和响应质量都有较大提升。

理想、创维、蔚来等汽车厂商随即蜂拥而入，用前沿的GPT能力让车机智能化程度更上一层楼。车机也彻底从最初的“收音机”变成了功能丰富的智能终端，加上GPT“大脑”后，又开始从木讷、鸡肋的机器向行车伙伴转变。

而人车交互不是AI上车的尽头，自动驾驶才是未来。以往的自动驾驶解决方案过于依赖高精地图，一旦地图更新跟不上瞬息万变的路况，行车安全将受到威胁。AI大模型的进化升级，让车企们看到了机会。

让AI主动感知和决策，放弃对高精地图的依赖，正在成为一种主流趋势。几天前，理想汽车开启城市NOA（导航辅助驾驶）内测，它将BEV(Bird’s eye view，鸟瞰图)大模型作为主要解决方案，让汽车模仿人类“脑回路”驾车。通过连续学习，城市NOA还能被训练成用户通勤路线上“代驾”。

接棒互联网，AI正在对汽车进行更深层次的改造，四个轮子的大家伙越来越神似变形金刚。

车机 GPT 奔驰先出手

一场由内而外的“变形记”正在席卷汽车圈，从传统燃油动力到新能源，从驾驶工具到智能化产品。多年以来，科技驱使下，汽车不断变幻着外貌和内在，互联网改造汽车后，人工智能又来了。

梅赛德斯-奔驰在这股新浪潮中一马当先，要把ChatGPT移植进车机。

6月16日，奔驰为期3个月的ChatGPT测试计划在美国启动，它与微软合作，通过Azure OpenAI服务将ChatGPT集成到车机中。车主可以通过Mercedes me APP选择使用ChatGPT，还有更直观测试方式——直接在车内使用语音命令“Hey Mercedes，我想加入测试计划”，奔驰的MBUX信息娱乐系统就会将语音助手“Hey Mercedes”自动接入ChatGPT。

过往，Hey Mercedes可以提供体育、天气等信息，并回答有关车辆周围环境的问题，还能控制用户的智能家居，这都是制式化的。ChatGPT加入把问答变灵活了，用户能询问目的地详细信息，获得晚餐建议，可以不断提出问题，连续收到回复。这是ChatGPT的看家本领。

当前，仅在美国地区约90万辆配备MBUX的奔驰汽车可以优先测试ChatGPT，奔驰打算利用这个初始测试期深入了解用户提出的请求，来确定未来开发的优先事项，以及调整不同市场和语言的推出策略。

关于接入ChatGPT这事儿，奔驰给了一个充满感性的声明，“一切目标都围绕着重新定义您与梅赛德斯的关系。”奔驰要让ChatGPT重塑人车交互体验，更形象的类比是，车机从一个木讷的注重功能性的机器“活”起来了，向着车内生活伙伴的角色转变。

奔驰之后，国内的汽车厂商率先跟上。

6月19日，理想汽车推出了自研的认知大模型“Mind GPT”，这个大模型由理想的空间算法团队研发。据说大模型训练的开始日期早在ChatGPT发布之前，MindGPT基于数10TB的原始训练数据，使用了1.3万亿个Token进行基座模型训练，能识别声纹和语音内容，还能听懂方言，同时能为车主提供出行规划，甚至具备AI绘画和AI计算等功能。

理想透露，Mind GPT发布后，理想汽车将新增LUI（用户语言界面）交互方式，“比如你想吃个火锅，只需要呼叫理想同学，车机界面就会生成火锅的图片供你选择，随后自动算好出行路线。”

创维汽车也在近日宣布，旗下两款车型创维EV6Ⅱ及创维HT-iⅡ在智能车机上集成了ChatGPT，此外，长城汽车、蔚来汽车、小鹏汽车、奇瑞汽车四家车企都在上个月申请了GPT相关商标。

GPT上车成为一股潮流。奥纬咨询董事合伙人张君毅认为，GPT技术的接入能够提升车的人机交互能力和综合环境问题的互动能力。今后车企在同一价位段的硬件方面的品牌差异会越来越小，当舒适性、安全性、动力和续航里程上竞争难以产生太大的差异时，卷智能就成了必然选择。

给智能座舱装上“大脑”

ChatGPT上车又是汽车进化史上可书的一笔，最前沿的自然语言处理大模型应用到了人类的出行工具上，更丰富的车内生活体验将会出现。

回望30多年前，车载娱乐功能和车机智能化，尚是一片空白。第一代车机诞生于上世纪80-90年代，当时人们普遍的关注点还是汽车的发动机、底盘和变速箱“三大件”，突然有一些车型不仅能听收音机，还能吞进磁带，自由播放音乐，汽车有了一些第二生活空间的影子。

第二代车机则加入了DVD播放、MP3，娱乐性凸显的同时，汽车又向驾驶体验迈了一步，加入了车载导航。此时，解决“路盲”问题成为一个主流趋势。许多老司机一定记得，在没有车联网的时代，凯立德车载导航成了高端车型的标配，它使用GPS卫星定位和存在车机里的地图包数据，实现相对准确的导航精度。

但除了导航和听歌、收音之外，当时的人们并不对车机抱有太多期待，车机也往往不是决定购车与否的主要因素。

进入21世纪，电子数码技术不断发展，手机的形态先变了。循着这个进化思路，车机上出现大屏，智能化成为新卖点。基于linux、WinCE、安卓等系统的车机陆续被汽车厂商采用，而后汽车不仅可以免费实时导航，还具备全景可视系统、汽车驾驶辅助系统，比如360度影像等。

当汽车连了网，一切由变得更不一样。在线观影、路书、语音控制、预约保养、远程诊断等功能被加入车机，中控台的屏幕越来越大，功能越来越多，一些厂商直接在驾驶室装上了比平板电脑还大的显示屏，甚至厂商们近来卷起了“全面屏”，就连副驾和后排都要装上屏幕。

终于，“第三块屏”的概念越来越显眼，主机厂们希望，车机能够成为继电脑和手机之后，影响人类生活的第三代智能终端。用富含科技感的车机占领用户心智，拓展更多的商业模式，成为现在的车企们攻坚的方向。

现在，“车机”这一原始概念逐渐被“智能座舱”所替代。蔚来甚至造出了“第二起居室”的新词，不仅车机越来越智能化，车企们开始卷内饰用料、音响系统、灯光系统，蔚来还发布了一款AR眼镜，支持随车巨幕观影;理想L9甚至配备了一个后排冰箱，让汽车成了可移动的房子。

但无论是车机还是智能座舱，语音对话一直都是发展相对滞后的功能，考虑到驾驶安全性，语音操控又十分必要。

过去近十年来，几乎所有车企和大量的AI创业公司，在自然语言处理领域投入颇多，希望优化车内的语音交互体验。许多车机都能回答简单的预设命令，比如调高温度、预报天气等，升级和创新围绕拓宽自然语言口令展开，比如当用户说“有点热”后，车机可以打开空调制冷或调低温度。

但想让车机听懂更多“人话”，比如用各种方言规划路线、甚至找餐馆，可能还真不如车主自己用手机地图和大众点评来得有效，更丰富的语音式人车交互陷入瓶颈，直到ChatGPT出现。

自然语言大模型产品（ChatGPT、文心一言、通义千问等）直接开放给C端使用，使智能座舱的开发者们看到了曙光。强大的理解能力和逻辑推理能力，有望让车机成为行车助手，暗藏商业可能。

比如，车主可以告诉语音助手，“帮我找出目的地附近有团购优惠、评分超过4.5的火锅店，一会有5个人用餐，给我预定一下位置，再看一下哪里停车方便。”放在以前，车机绝对无法一次性理解如此多的信息，但对ChatGPT来说，这只是它的基操，只要实时数据源足够多，需求被满足的可能性能够无限大。

GPT的加入并不只是让对话更流畅了，而是让车机具有了“大脑”，不仅能回答问题，还能理解需求并生成答复。至于智商有多高、反应有多快，取决于汽车厂商对上车大模型的训练能力，以及敢不敢“氪”金上更牛的硬件（芯片）。

AI如何让自动驾驶“脑回路”更像人?

车内生活的丰富，让汽车逐渐成长为一个充满温情的载体，它不再是枯燥、冰冷的代步工具，转而成为一个舒适的生活空间。

而AI主导的汽车进化还不止于GPT上车，它对自动驾驶的技术推动更加意义重大。

传统的自动驾驶研究方法是通过采集大规模的驾驶数据、测试更长的驾驶里程来覆盖所有可能的驾驶场景，以确保发生突发状况时汽车有预先设定的应对方案。但突发状况的复杂程度往往难以预料，一旦系统中没有应对某种特殊突发状况的预案，驾驶安全就将受到极大的威胁。

这也是为什么当前的辅助驾驶系统，必须要求驾驶员手扶方向盘以应对实时突发情况。而AI的学习能力将有可能改变这个现状。

不久前，清华大学研究团队提出了自动驾驶“可信持续进化”技术，该技术是基于动态评估AI的可信赖程度进行学习训练，保证自动驾驶汽车在遇到陌生新场景时，其驾驶能力可从基础性的主动避让开始持续提升，在确保安全前提下达到更好的驾驶表现。

简单理解，利用AI，自动驾驶功能的汽车能主动学习、熟悉各种新遇到的场景，进行持续进化，随着驾驶里程与数据量的累积，性能得到持续提升。

理想汽车正将AI大模型用到自动驾驶领域。6月17日，理想宣布开启城市NOA（导航辅助驾驶）内测，并将在下半年向用户开放通勤NOA功能。与常规解决方案不同的是，理想采用了BEV(Bird’s eye view，鸟瞰图)大模型，来实时感知和理解环境中的道路结构信息，让汽车更能模仿人类驾驶员的操作习惯。

以往多数汽车上的辅助驾驶系统，大多是采用高精地图方案，相当于实时把路况投喂给自动驾驶系统，让其做出决策。但在复杂的城市道路中，总会有高精地图无法覆盖和无法及时更新的区域，这成为了该方案的一大缺点。而采用BEV大模型后，相当于AI主动感知实时路况，自主决策驾驶操作。

当然，BEV也有缺点，例如在一些跨度较大的路口，通行车辆较多，传感器视野容易被遮挡，导致车端实时感知的结果会丢失局部的信息。为了弥补这一不足，理想据称搭配了神经先验网络（NeuralPriorNet，简称NPN）和端到端的信号灯意图网络，前者的作用相当于每当车走过自动驾驶车队走过的路口，都有图像参考;后者则是学习大量人类司机在路口对于信号灯变化的反应，帮助自动驾驶系统理解交通信号。

使用NPN网络弥补BEV模型缺陷

根据实际的测试反馈，理想城市NOA还不能够完全实现自动驾驶，它存在转弯不够及时和不擅长超车的问题，此外，面对一些特殊障碍物，算法无法做出决策，必须进行人工接管。

不过，相比于传统的训练方式，大模型的引入最大的改变还是让自动驾驶系统有了更强的学习能力，这意味着自动驾驶能力会逐渐提升。典型的案例是，理想汽车推出了通勤NOA功能，在开启该功能之前，车主需要先设定通勤路线，通过日常通勤时的自动化训练积累NPN特征，大约1至3周时间后，AI可以成长为通勤路段的“代驾”。

这个过程体现了AI大模型加持下的自动驾驶汽车操作思路:先学习和熟悉路况，再进行辅助驾驶，“脑回路”更像人类了。

用AI大模型研发自动驾驶鼻祖不是理想，而是特斯拉。早在2021年，特斯拉就曾推出基于Transformer架构的BEV感知方案，随后华为、百度等企业也在“BEV Transformer”上展开布局，目前，特斯拉、小鹏汽车、问界汽车等都在落地和不断优化类“城市NOA”功能。

大模型的持续进化，很可能让车企们找到了自动驾驶技术的突破方向，摆脱对高精度地图的依赖是第一步。现在的自动驾驶还停留在“辅助驾驶”阶段，未来，你很有可能会将你的交给AI接管。