新势力又要摸着马斯克过河了

  在摸着马斯克过河之前,何小鹏先摸了一把前同事。

  “特斯拉的研发进度领先国内智能驾驶 1.5-2 年。”7 月初,前小鹏自动驾驶研发副总裁谷俊丽的一番言论,引发外界争议。

  自此之后,车企大佬几乎再无人敢直接点评特斯拉与中国车企在智能驾驶方面的具体差距。近期,轮到何小鹏点评时,他也只是轻轻赞扬了一番,表示过去自己一直觉得谷歌母公司旗下的 Waymo,是神一般的存在,但 6 月份去旧金山体验完特斯拉 FSD V12 版本后,感到“非常非常惊讶,跟以前完全不是一个版本了。”

  让何小鹏惊讶的秘密武器,便来自特斯拉于今年初正式上线的,端到端自动驾驶技术新版本 FSD V12。

  特斯拉 FSD V12,最大的改变是用了“端到端” 架构,即一端输入摄像头等传感器获得的数据,另一端直接输出车该怎么开。

  在此之前,自动驾驶采用的是模块化方案,即把感知、预测、规划等划分为各自独立的模块,完全依赖工程师编写大量代码去制定行驶规则,从而告诉车遇到什么样的状况时,该采用哪些规则指令。

  如果将模块化方案视作 iPhone 中的 Siri,那么端到端的出现,无疑就是 ChatGPT 时刻的降临。

  喊出全球唯二、中国唯一实现端到端大模型量产落地车企的何小鹏,在谈及特斯拉 FSD 有望年底进入中国的话题时,给出的答案是不担心后者的竞争。

  同样不想落后特斯拉一步的华为,在 4 月份发布乾崑 ADS 3.0 架构时,也开始强调“端到端”技术。7 月份的理想智能驾驶夏季发布会上,官方也发布了基于端到端模型、VLM 视觉语言模型和世界模型的全新自动驾驶技术架构。近期蔚来也官宣其智能驾驶技术架构 NADArch2.0,正式引入世界模型的端到端架构。

  理想、蔚来所谓的“世界模型”概念,也多少带些特斯拉的影子。

  2021 年特斯拉 AI Day 上,通过仿真模拟,借助 Dojo 超算能力,马斯克给特斯拉规划了一条通往完全自动驾驶的可行性路径,即借助虚拟仿真技术,来测试边缘情况和其他行驶过程中可能遇到的意外问题,“用自动驾驶来重现自动驾驶场景。”马斯克说道。

  十年前,“蔚小理”创立之初,纷纷摸着特斯拉打开了消费者对电动汽车的认知。十年后,面对 AI 大模型带来的新一轮技术变革,新势力们又一次跟紧了特斯拉的步伐。

  且这次的竞争,可能比十年前更激烈。

  2014 年,是智能汽车史上一个关键节点。从这年开始,汽车范式变革席卷全球,汽车工业进入跨界创新时代:传统的机械与制造模式,被新兴的新能源与电子电气技术一步步赶超。

  一个软件驱动汽车的新时代来临,汽车工业就此开始转向基于 ICT 和互联网技术的经济范式。原本适用于消费电子行业的边际成本效应,开始在汽车领域发挥作用。

  尽管前期智能化研发投入成本高昂,但一旦成功之后,其复制扩张的边际成本将变得无限低。“大家只能玩了命比研发、比技术,这就是为什么消费电子行业,如手机等,都是赢家通吃。”雷军在近期接受李翔专访时说。

  如今,赢家通吃的前景和压力,一同涌到了新势力面前。

  A

  质疑特斯拉、理解特斯拉,到成为特斯拉的一幕,正在车圈轮番上演。

  2013 研发辅助自动驾驶功能 Autopilot 时,特斯拉也是老老实实采用了前辈谷歌开辟的路径,即用激光雷达、摄像头等传感器收集数据,人工标注之后,再让工程师编写行驶规则代码,从而决定车该怎么开。

  转变在 2021 年到来。为了节省成本和更快速普及自动驾驶功能,马斯克决定放弃激光雷达和高精地图,改用纯视觉方案。

  2021 年 5 月份,特斯拉正式决定去掉量产车上此前标配的毫米波雷达,仅保留全车八个摄像头,来为特斯拉 FSD 采集外部环境数据。

  2021 年 7 月 31 日,特斯拉开始推送 FSD 全新版本 FSD Beta V9.1,这是首个使用“特斯拉纯视觉”方案的辅助驾驶套件。

  自此之后,自动驾驶领域被分成了两大流派——纯视觉派和激光雷达派,前者以特斯拉为首,后者以小鹏、蔚来等为首。

  让马斯克敢于做出放弃激光雷达决定的一大原因,在于特斯拉更新了以 Transformer 为基础的 BEV(Bird's Eye View,鸟瞰视野)感知模型,其不需要依赖高精地图,便可实现辅助自动驾驶功能。

  在 BEV+Transformer 架构之外,特斯拉随后又加入了占用网络技术(OCC),使得纯视觉方案的导航精准度进一步提升。

  在特斯拉改用纯视觉方案一年后,2022 年下半年,蔚小理、华为、比亚迪等,都开始摸着特斯拉过河,转向研发不依赖高精地图的 BEV+Transformer 方案。

  比亚迪智能驾驶业务负责人韩冰,甚至在去年中的一场活动上说道:“BEV 是比亚迪在高阶智能驾驶上弯道超车的机会。”

  也正是由于排除了高精地图的牵绊,2023 年,中国车企展开了比拼 NOA(领航辅助驾驶)开城速度的新竞赛。

  余承东就曾感慨过,华为在上海投入一两年,都没采集完城区高精地图,“上海一条小路都要折腾很久。”

  除了提速 NOA 开城速度之外,特斯拉所引领的纯视觉方案,还让新势力们看到了将高阶智驾技术,下放到平价车型上的可能性。

  3 月份发布的小米 SU7,其 Pro/Max 版本采用激光雷达方案,标准版则走了纯视觉方案;小鹏 8 月份上市的 M03,也会配备不同智驾方案,这将是小鹏首次在量产车上应用纯视觉路线;蔚来 9 月份上市的第二品牌乐道 L60,同样出于成本考量,取消了激光雷达,换用纯视觉方案。

  为了抢占更多车企合作订单,华为也在今年正式发布了视觉智驾方案——HUAWEI ADS 基础版,号称可实现全国高速城快路段的智能辅助驾驶,以及智能泊车功能,目前已经相继应用在智界 S7 和深蓝 S07 上。

  随着 AI 大模型在 2022 年爆火,被特斯拉引燃的端到端智驾新路线,则成为继“BEV+Transformer+OCC 占用网络”智驾方案之后,车企竞逐的新目标。

  B

  想要实现端到端,车企的视觉神经网络就需要采集更大量、更多样化和更真实的数据样本,同时用更低时延的算力对数据加以解析利用。

  这直接催生了三年前特斯拉超算系统 Dojo 的诞生。

  2021 年特斯拉 AI Day 上,马斯克宣称 Dojo 效率已经超过了英伟达 GPU 和谷歌 TPU。为了实现地表最强目标,特斯拉自主研发了首款 AI 训练芯片 D1。7nm 制程的 D1,运算处理能力可以达到 362 TFLOPS(相当于每秒 362 万亿次的浮点运算)。

  D1 之前,马斯克就凭借 FSD 推理芯片诞生,让特斯拉坐上了全世界第一个自研智能驾驶芯片的车企的宝座。

  在 2019 年特斯拉量产 FSD 芯片后,蔚小理相继于 2020 年组建起自己的芯片团队。

  在智能汽车领域,为了实现更好的性能优化,从芯片、算法到操作系统,一体化自研已经成为越来越多车企攻克的方向。在头部新能源车企身上,表现尤为明显。何小鹏也曾公开发表观点,认为“像苹果这样的软硬件一体可控模式,在智能汽车企业里面会出现越来越多”。

  随着特斯拉在软硬一体道路上越走越远,新势力们也开始加足马力追赶。

  进入 2024 年 7 月份,蔚小理四年造芯路,终于有了成果:蔚来在 NIO IN 2024 上对外宣布,全球首颗 5nm 智能驾驶芯片——神玑 NX9031 流片成功。该芯片有望于 2025 年一季度首搭蔚来旗舰轿车 ET9。

  同时,据 36 氪汽车爆料,小鹏汽车自研的智驾芯片也已经送去流片,“预计 8 月回片。”

  理想汽车的智驾芯片也将于年内完成流片。

  更好地控制成本,成为诱导新势力们下场造芯的主要原因之一。

  “如果理想自己做推理芯片,可以做到像特斯拉一样的成本,因为算法掌握在自己的手里,也包括后面整个的训练平台、训练芯片自己做。” 李想曾如此讲到,甚至还评估过特斯拉做 AI 训练芯片 D1 的具体缩减成本,“大概能做到英伟达 A100 六分之一的成本。”

  值得一提的是,在英伟达芯片断供危机之下,新势力们的芯片自研,还开始承担起保卫供应链安全的战略价值。

  且随着芯片不断迭代,其对车企带来的成本优化空间还会进一步扩大。二季度财报会上,马斯克表示,下一代特斯拉 AI 芯片,也就是 HW5,从推理能力的角度来看,“它可以与英伟达 GB 200 相媲美。”

  C

  但无论推进端到端,还是自研芯片,对于尚处在亏损阶段的大多数新势力而言,都将是一笔承压的投资。

  智能驾驶等高算力芯片,研发周期长、资金投入大,且不确定性高。有数据统计,一颗高算力芯片的研发和量产,至少需要花费十几亿元。

  为车企供应智驾芯片的地平线创始人兼 CEO 余凯更是直言,车企应该慎重考虑自研智能驾驶芯片问题。“自研和他山之石本身是战略选择,如果车厂的年销量预期不到 100 万辆,资金的整个效率其实是算不过账的。”

  这考验着车企的规模效应。只有卖出更多的车,才能平摊这些研发支出,并发挥出自研芯片的成本优势。

  环顾全球新能源车企,2023 年,仅有比亚迪和特斯拉两家,达成了年销百万辆的目标。

  更不容忽视的是,规模效应还将帮助车企在端到端竞争中获取更多数据支持。

  端到端模型上限很高,有望直指自动驾驶的 L5 级别,但它的下限很低,在一些基础状况下,甚至比不上模块化方案,如采用端到端路线的特斯拉 FSD V12 版本上线后,被不少人测试出车辆撞到马路牙、损坏轮毂的低级错误。

  避开上述低级错误的主要方法,就是投喂给端到端模型更多的资源,包括算力、算法和数据等。

  去年财报会上,马斯克便谈到数据对自动驾驶模型的重要性:“用 100 万个视频片段训练,勉强够用;200 万个,稍好一些;300 万个,就会感到 Wow;到了 1000 万个,就变得难以置信了。”

  但并不是所有的行车数据都可以用来训练端到端模型。这方面,汽车跟 ChatGPT 等大模型一样,考验的是厂商处理数据的细节。

  “在以数据为中心(data-centric)的 AI 新时代,模型能不能出彩实际上主要是靠数据。”大模型从业者李振曾向字母榜(ID:wujicaijing)解释,数据里面潜藏的诸多魔鬼细节,甚至决定着大模型产品的成败。

  谷歌就是前车之鉴。不管从算力还是算法,谷歌并不比 OpenAI 差,甚至还要强,但恰恰是借助基于人类反馈的强化数据训练工作,OpenAI 最终赶在谷歌前面做出了 ChatGPT。

  “特斯拉为什么能够遥遥领先?是因为它有销量作为基础。”在谷俊丽看来,要在商业模式上追赶特斯拉,必须形成产品的规模化。

  而特斯拉留给新势力们追赶的窗口正在收紧。根据马斯克预测,随着 FSD V12.5 版本,或者 12.6 版本的推出,最快今年年底,中国、欧洲等国家和地区,就可以获得落地批准。

  规模效应之外,凭借自我造血能力,马斯克还给这场端到端竞赛,划定了一个入场门槛。在 4 月份访华当天,马斯克发文称,“特斯拉今年将斥资约 100 亿美元用于 AI 的训练和推理,后者主要用于汽车。任何公司,如果没有达到这样的支出水平,并且不能高效地完成这项工作,就无法参与竞争。”

  用十年熬过规模量产挑战之后,一场新的淘汰赛再次摆在了新势力面前。

  参考资料:

  《关于造车,雷军近年唯一深度专访》雷军

  《放弃雷达,国内车企倒戈纯视觉路线》中国汽车报

  《蔚来、小鹏等自研智驾芯片将流片,上车进入倒计时》36 氪

  《理想自研芯片进展:在新加坡设立办公室,团队规模已超 160 人》晚点 Auto

  《特斯拉从此无禁区,但 FSD 入华还没时间表》盒饭财经