近日,智能驾驶的热浪席卷了成都车展,其中值得关注的一点是,纯视觉的风头正劲,问界M7 pro、小鹏MONA M03、深蓝S7乾崑智驾版,多款车型都推出了纯视觉版本。
在大模型等AI技术的加持下,以数据驱动代替以规则驱动的端到端方案,成为近来智驾的演化方向。在新的技术下,以摄像头为感知元器件的纯视觉方案,其智驾能力有了长足进步,而同为感知元器件,激光雷达则在一些新的车型方案中不见了踪影。
一时间,舆论四起。激光雷达“落寞”了?对于很多追求降低成本的车企来说激光雷达要被砍掉了?甚至,在智能驾驶的未来,激光雷达要被端到端“杀死”?
来自特斯拉FSD的启发
在智驾功能的感知元器件的应用上,特斯拉实际是很多国内企业的“镜像”与参考。特斯拉的CEO马斯克,一直非常坚定地反对激光雷达,他曾多次在公开场合表示“激光雷达毫无意义,对于自动驾驶汽车来说没有必要”等等。
特斯拉对激光雷达的“无感”,除了可能出于CEO的个人好恶之外,也与激光雷达的成本息息相关,而支撑特斯拉能够抛弃激光雷达的,则是其出色的算法。
特斯拉依靠FSD架构,实现了仅靠纯视觉(摄像头)作为感知元器件,就能实现感知、规划、控制的智驾功能,而算法则是其核心。今年1月,特斯拉FSD升级到了基于“端到端”的V12版本,改变了行业企业此前模块化智驾方案对规则、对激光雷达感知信息等的依赖,也带动一众车企和服务商纷纷转向,加码端到端。
所谓“端到端”,其实是来自深度学习中的概念,英文为“End—to—End(E2E)”,指通过一个AI模型,只要输入原始数据就可以输出最终结果。应用到自动驾驶领域,意味着只需要一个模型,就能把传感器收集到的感知信息,转换成车辆方向盘的转动角度、加速踏板的踩踏深度以及制动的力度等具体操作指令,让汽车实现自动驾驶。
国内某头部激光雷达企业工程师程苒亦(化名)告诉记者,以往特斯拉不使用激光雷达而走纯视觉路线,主要源于当时处于行业发展早期,动辄几十万元一枚的激光雷达价格对于量产车而言过于高昂。目前激光雷达发展已进入成熟阶段,成本下降到千元级别状态,进入了低使用门槛的局面。
“但大模型技术的发展,使必须依赖激光雷达才能实现的智驾应用场景不断降低,而且随着不断发展,我认为有一定概率,这类应用会降到一个非常低的水平上。芯片的算力还在不断地快速提升,在端到端的助力下,视觉方案的能力上限显示出非常好的成长性。”国内某整车企业工程师告诉记者,“而且随着采用端到端方案的车型数量增长,数据量也会不断累积,推动训练效果会有更好的表现。这些都让我们判断,纯视觉方案会有更好的前景。”
双方的优劣势都有啥
然而,未来的智能驾驶,到底是谁的天下,可能还需要近一步来看端到端和激光雷达,谁“进化”更快。
首先来看激光雷达。
制约激光雷达上车最核心的因素就在于成本。然而,在今年的北京车展期间,速腾聚创发布了其新一代中长距离激光雷达产品MX,除了技术指标之外,速腾聚创打出了另外一个概念就是——“MX将以低于200美金的成本为基础实现第一个项目量产”。而“200美金”的概念,回应的就是一段时间以来,行业因激光雷达成本而产生的“踟蹰”。另一家激光雷达服务商图达通也推出了千元机级别的905nm产品RobinE。
对于激光雷达的优势,程苒亦表示,智驾场景中,纯视觉仍存在一些尚无法较好处理的复杂情况,激光雷达在其中具有显著优势。例如目前各大车厂在卷的城市NOA中,带城市NOA功能的车大部分都搭载了激光雷达。而目前阶段城市NOA遇到的诸多技术挑战,例如需要自车感知车道级定位,超出视觉感知场景库的异常小物体、人车混杂等情况容易漏判、误判,黑夜、逆光环境下等,这些技术挑战是现阶段以视觉为基础的城市NOA系统难以应对的,需要激光雷达提供真实可靠的感知支持。
再来看看端到端。
端到端的“进化”几乎是“力大飞砖”。从去年开始,百度、华为、理想、蔚来、商汤等公司都开始快速切换技术路线,加速推动端到端技术的落地。由于端到端的本质是打通数据闭环的训练,解决Corner Case场景下安全性不高的问题,其核心是将功能模块神经网络化。因此其神经网络的参数规模通常非常高,带来对芯片的需求奇高。特斯拉计划在德州工厂上建设数据中心,以布置应用其10万张的GPU以及各种特斯拉自研的运算加速器。国内行业为了端到端开发也有很多企业布置了千卡集群。
算力的提升,能够使大模型处理的参数数量明显提升,这将带来智驾效果上限的明显提升。但大模型的训练难度依然不低,以特斯拉为例,目前其FSD累计学习的人类驾驶视频片段超过2000万个,而这一规模的数据仅采集成本就需要50亿至80亿元。而显然,端到端也并非自动驾驶的最终形态,多模态的端到端可能是随后的技术方向。
车企会怎么选择?
根据近期车型上市的情况梳理,我们可以明确地感受到,智驾方案在分化。
例如8月21日上市的长城魏牌蓝山,搭载了禾赛科技的AT128;成都车展上首秀的极氪7X搭载了速腾聚创的激光雷达,同期上市的广汽埃安霸王龙520装配了速腾聚创M平台激光雷达。而在文章开头提到的车型,则坚定地走起了“纯视觉”路线。
“我觉得目前OEM对激光雷达的态度,其实取决于多重因素。”国内某家智驾方案提供商的工程师林晟(化名)分析认为,“首先是智驾方案的多样性。即便是同一家企业当中,也会根据市场、用户需求,对车型进行区隔、定义,然后根据成本匹配不同硬件。所以我们未来会看到更多的企业,选择纯视觉方案、视觉+毫米波雷达、视觉+毫米波雷达+激光雷达等不同方案配置在自己不同的产品线上。高端一些的产品将搭载激光雷达,作为提升性能,增加冗余的配置,中档及入门的产品将采用摄像头、毫米波雷达的组合配置。所以从这个角度来看,激光雷达之于OEM与其说是技术问题,不如说是商业问题。”
“我认为另一个重要因素是芯片的成本。端到端的算法、训练都需要大量的芯片做支撑;纯视觉方案,对车端芯片的算力要求也比较苛刻,所以从这个角度来看,芯片的进步、成本的降低与激光雷达的性能进步、成本降低,构成了天平的两端。”林晟表示,“还有一个隐性的边界,就是消费者的感知。智驾表现不能单纯等同于‘堆硬件’,如何让智驾功能的表现被用户感知到,认可智驾功能带来的价值,是非常关键的。”
“我们认为,端到端的视觉路线将与激光雷达方案在相当长时间内并存,各自发展。考虑到高速行驶极大压缩了决策执行时间,感知距离和精度必然有更高需求,而全天候(昼夜、雨雪)的智驾功能实现,也需要感知有更强的抗干扰性。因此,我们认为激光雷达是智驾的必选项。”程苒亦认为,“与不同的技术路线同台竞技共同发展,更要求激光雷达能够进一步提升性能,进一步降低成本。”