90后AI天才造卡车,靠端到端进自动驾驶第一梯队

  李根一凡发自凹非寺隔壁的副驾寺

  智能车参考公众号 AI4Auto

  自动驾驶,并不是黄泽铧再创业计划里的首要任务。

  作为全球无人车第一股图森未来的联合创始人,他完整参与了一次决策式 AI 驱动的自动驾驶从 0 到1,缔造了全球自动驾驶第一股,而且作为计算机名校 CMU 的高材生,再出发没有首选软件方向,出乎不少人意料之外。

  是的,黄泽铧再创业的零一汽车,从新能源重卡出发,最开始甚至精确到短途。

  但这似乎又只是一个“烟雾弹”,因为就在今年 AI 顶会 CVPR 的国际自动驾驶挑战赛上,创办才 2 年的造车公司零一低调参赛,然后名列第二,成绩仅次于巨头英伟达,而且还是最前沿的端到端赛道。

  不鸣则已,一鸣惊人。模型能力首次验证,就是全球第一梯队。

  加上零一在造车上的快速量产交付、智能化重卡生态联盟上的效应……“没有首选自动驾驶”的黄泽铧,似乎又在另一个更大的层面实践着自动驾驶的终极落地。

  他自己也承认,零一汽车的前景都在明面上——

  • 造新能源卡车,百亿元规模。
  • 把新能源重卡做到中国最好,千亿元规模。
  • 但如果叠加规模化自动驾驶落地、运营场景和全球化平台,面向的就是万亿规模。

  实际上,自动驾驶始终是 90 后 AI 大牛黄泽铧造车里的必要一环,但对于全球高手华山论剑里的成绩,他一方面觉得体现出了模型能力,另一方面也感慨:幸运女神眷顾,刚好生逢其时。

  这个,无他——大模型改写一切,端到端重塑自动驾驶范式。

  端到端,把桌子掀翻了

  全球第二的成绩,并不完全在意料之内。

  黄泽铧说,这次参赛其实只是一次很简单的尝试。

  但在 2022 年年底,零一汽车就已经开始投入端到端相关的研发,所以到了今年 CVPR 挑战赛,基本就是拿着已经内部相对研发成熟的系统做了应用,而且仅用了视觉的信号,就取得了非常好的成绩,这着实令团队上下倍感鼓舞。

  黄泽铧透露,零一汽车在端到端的投入上,团队不大,效果却被证明很好,体现了团队在基础模型、系统研发上的能力。

  同时也是技术范式变革之力的展现。

  他举例,OpenAI 的 GPT-4o 的语音对话能力,很轻松就超过了 Siri,可是 OpenAI 投入的可能也就只有小几十个人,远远不像 Siri,可能有上千个工程师在做研发。

  所以在技术范式变革的时期,对的人和好用的模型,远比人数和数据参数规模重要。

  当然,更早洞察了生成式 AI 带来的技术变革,更早拥抱端到端,同样在零一汽车的 CVPR 成绩中发挥了“天时”作用。

  黄泽铧软件背景多一些,在 CMU 学的是机器人,这是全球自动驾驶的头号黄埔军校,毕业后又直接加入图森未来开启了创业,完整走过了自动驾驶从技术到工程、从一辆车到一个车队的历程。

  于是当 ChatGPT 横空出世,他很快意识到对于整个 AI 和自动驾驶技术范式意味着什么,这也是零一低调开启自动驾驶研发的机缘。

  运气也站在了零一这一边。黄泽铧有自动驾驶的经验和经历,但却因为生逢其时,可以用端到端的方式另起炉灶,没有包袱,不用转型,可以小步快跑。

  黄泽铧透露,零一汽车的创业,从一开始的出发点就是因为他看到了自动驾驶的最大短板在于车本身,所以明确应该专注于把车造好,并且明确不做自动驾驶的上层系统,避免有限的资源投入重复造轮子的泥潭中。

  然而就在 ChatGPT 之后,他发现自动驾驶技术范式,发生了根本性变化,可以把过去的自动驾驶能力,实现十倍到百倍的提升,于是内部深思熟虑一个月之后,决定打破最初的坚持——开启自动驾驶研发,完全端到端方式推进,是起点也是终点。

  一切是时候了。

  端到端自动驾驶的火爆和热议,是伴随 2023 年 CVPR 最佳论文开始的。

  不过在黄泽铧看来,端到端在自动驾驶范式里,不是原因,而是结果。

  因为早在上世纪 90 年代,就有过设想讨论,2016 年英伟达也发过知名影响力的论文。

  核心系统也很直接:把摄像头作为输入,然后把车的轨迹作为一个映射。

  然而在当时的技术范式下,实现端到端,非常容易过拟合,或者说会陷入局部最小值。那时候 AI 系统对于世界和数据的理解能力非常有限,小 demo 可以 work,规模一大可能就失效了。

  所以黄泽铧看来,端到端自动驾驶之所以现在是时候了,是因为大语言模型让 AI 有了常识系统,AI 有了理解世界的能力。

  看到红灯就停,识别到了水坑该怎么开……AI 有了对人类世界的理解,还会进一步做相关的推理。

  这种质变,也是世界模型开始被推动建立的关键。

  黄泽铧甚至认为,世界模型已经建立起来了。有了大语言模型和大视觉模型为基础,整个世界就能被投射到自动驾驶当中,有了端到端落地的基础。

  而大道至简,端到端也摆脱了过去人为的模块化定义及其相应的信息减损,不必再写具体而复杂的规则,自动驾驶大规模落地的瓶颈也被相应解决了。

  “不用再写规则告诉 AI 系统遇到红灯该停下来,AI 有了常识理解能力,现在只需要一张图,它就知道需要停下来了。”

  过去复杂的模型被大大简化,而简化,就意味着工程上的巨大改变。

  黄泽铧类比:桌子被掀翻了。

  首先是人才和组织管理层面。

  AI 人才更加稀缺,懂模型训练、数据中台系统相关的人才更加紧俏。

  同时放到3~5 年的尺度看,端到端本质在简化自动驾驶,也就会简化之前很多堆栈里的工程师,不论是定位、地图,还是预测规划。自动驾驶的研发组织,面临一场重组革命。甚至人力密集的标注产业,也会因之发生很大的变化。端到端会让更多驾驶数据的标注自动化。而懂模型,或者能够用好开源基础模型的架构师,价值会得到进一步凸显。

  其次是自动驾驶上层系统的变化。

  已经看得见的就是从 CPU 向 GPU 的算力体系转移,从多个小模型向单一大模型的转移。还有正在被探索的传感器方案,或许也会因为端到端迎来统一。

  第三是 Corner Case——长尾场景的解决应对,端到端能力明显。这就会让自动驾驶普及落地的进程大大加快。量产乘用车推进的脱脚、脱手、脱眼的功能性模式会被加快,同时行泊也会被真正打通,不再需要两个不同的系统。

  业内传播所用的“无图也能开、全国都能开、有路就能开”,就是端到端带来的底气。

  而这种端到端在场景迁移和泛化上的上限拉升,会带来更加核心的变化——

  L4 可能会不存在了。

  黄泽铧认为,端到端在可行的情况下其实只会有两个系统, L2 和 L5。

  曾经按照限定情况和限定工况的完全无人驾驶来定义出的 L4,本身就是人类规则内置的体现,而端到端,干掉了规则,可能就摧毁了 L4 的基石。

  最后,自动驾驶的商业化也会迎来真正的曙光。

  端到端之前,自动驾驶基于模块化系统,并没有展现出软件系统该有的边际效应商业模型。

  因为自动驾驶涉及与真实世界的交互,过去的边际成本极高,从一个场景迁移到另一个场景,需要投入的研发、人力资源等成本,不符合软件系统的商业模型。

  但端到端之后,完全数据驱动,场景不再会被切割,AI 系统不再有迁移成本,软件的边际效应威力就会展现,自动驾驶的商业化也将会迎来质变。

  黄泽铧认为,端到端掀翻了旧制度,然后正在重组新秩序。

  唯一重要又需要检验的问题只剩下一个:端到端的下限在哪儿?

  本质上,端到端是一个深度学习系统,可以视为一个概率模型。

  而端到端更是信息流到信息流的映射,如何从概率上保证输出结果的安全性,在自动驾驶上比其他 AI 应用领域更加重要。

  不过黄泽铧对此相对乐观,他觉得随着行业内更多力量的加入,这个问题不会是大问题。多年前黄泽铧参与过人脸识别的研发,很难想象现如今是金融级的寻常应用。

  AI 确实还存在很多复杂问题和挑战,但开车驾驶本身,其实并不是特别复杂。

  黄泽铧也不认同,一定需要完全可解释、完全打开黑箱,才是自动驾驶的终局。端到端确实是一个偏向黑盒的系统,但黑盒和不安全是不能等号的。

  “我们敢坐飞机不是因为飞机原理完全可解释了,而是它已经证明了足够安全。”

  实际上,即便没有端到端,黄泽铧对自动驾驶的信念也从未有过动摇。

  他说之所以再创业选择造车,就是希望解决卡车自动驾驶落地最大的短板——车。

  自动驾驶再创业,从造车开始

  “其实对于自动驾驶来说,最大的问题还是缺车。”

  在已经成功完成图森无人车的从 0 到 1 后,黄泽铧给出了上述再出发时的初心依据。

  他说过去做了 10 年的自动驾驶,一直围绕着卡车展开,但最后发现限制卡车自动驾驶推进的依然是车本身。相比轰轰烈烈的乘用车市场,卡车缺乏新能源变革的过程,很多底层技术没有经过改造。

  以终为始来看,自动驾驶卡车落地之难,在于缺乏一辆好用的卡车,缺乏一个好用的卡车平台。

  这种缺乏是痛点、是稀缺,也是真正希望实现自动驾驶落地的黄泽铧,看到的创业机遇

  在他的认知里,自动驾驶就是两个层次的系统:一个是上层系统,软件为核心;一个是底层系统,车辆硬件为基础。

  “需要把车作为自动驾驶的一部分。”

  黄泽铧认为,上一波自动驾驶从业者,实践中有这样的感触,但站在更大尺度上看自动驾驶,依然还不是多数人共识。

  马斯克依然是引领者,在卡车领域,特斯拉已经量产落地了 Semi 卡车,但 Semi 更多还是卡车的新能源历程,还没有走向智能化历程。

  于是黄泽铧认为,既然技术路径方向已经大致明确,那造车就算再难也需要势在必行,至少需要从造车方向上前进。

  命运的齿轮,也在此刻转动。

  就在计算机软件底色的黄泽铧坚定向硬件向造车而行时,与另一位资深的硬件大牛、卡车大咖张红松,一拍即合。

  张红松和黄泽铧不是同龄人,相比黄泽铧的 AI 少年天才,张红松代表着造车领域的传统与厚重,他已经在重卡领域战斗了 30 多年,曾是北京福田戴姆勒和三一重卡的副总裁,以及完成了三一重卡从立项到上市的全过程,深谙硬件研发、供应链和制造。

  他俩最早在黄泽铧的图森任职时有过接触交流,但不够深入。待黄泽铧回国后,机缘巧合下开始不断交流,他向松哥分享他的感悟,求教解决车辆在自动驾驶中的短板现状。

  而张红松也惊人发现,他从车企的角度,也在思考方向一致的问题。

  更重要的是,这种对撞交流中,两人发现底层逻辑价值观、思考问题的方式、性格相互吸引……

  所以既然思考相同的问题,为什么不通过创业的方式解决它?

  张红松和黄泽铧,“一老一少”组建零一汽车,正式开启造车创业。

  而且因为二人独一无二的经验和履历,对创业方向和项目发展想得清楚、划分得细致,进展也比预期顺利。

  战略上的准确性,让他们用时不到 2 年、耗费 1.5 亿左右,就完成了第一个平台两款车型的研发、制造和交付。

  黄泽铧也透露,乘用车造车,门槛公认的是 50-100 亿,但卡车之所以不同,是因为卡车的行业供应链可复用程度高,定制化开发少、专门的集成度也没那么多,可以把最合理的资源用到最需要的地方。

  他也坦承,2 年零一造车的过程,也并非事事顺利,犯错误买单在所难免,但因为零一汽车有着方向上的大致正确、团队不断解决问题的心态和执行力,保证了至今超预期的交付。

  对于零一汽车,黄泽铧有着自己的“三级火箭”——

  第一级,先把车造好,上牌桌。然后把车卖好,获得头部市占率,完成造车从研发到商业上的闭环,实现企业发展的飞轮循环。第一级做完,基本就获得了下一赛段入场券。

  第二级:打造自动驾驶基座和平台,整车系统深度自研以及深入针对一些场景,深入做好无人化落地。这将是为新能源而生的全新重卡整车平台,为无人驾驶而生的智能整车平台。

  接着就是第三级,自动驾驶量产、规模化商用,无人驾驶与整车智能化完全整合,实现最大范围和场景的自动驾驶目标。

  以马斯克的 SpaceX 类比,黄泽铧的三级火箭里,第一级造车负责摆脱地心引力,进入太空;第二级第三级自动驾驶,则是能够进入火星轨道并且最终落地火星。

  而现在,随着量产车制造交付以及源源不断的销量订单反馈,零一汽车的第一级火箭,正在不断入轨。

  当然,面向星辰大海,沿途也能开花结果。

  除了造车,零一汽车也把新能源和智能化相关的能力,做了开放合作,以零动智卡联盟的方式赋能卡车行业。

  黄泽铧之前也谈论过,卡车区别于乘用车供应链,专属定制的没那么多,共享复用的很多。

  而零一汽车恰好能给这个更传统的汽车细分市场,既带来新能源的共享,也能带来自动驾驶相关的复用。

  对于零一汽车,这种赋能利他,最后也是在创造共赢,因为卡车或者商用车面向的细分场景太多,如果能有更多的玩家,直接通过零一汽车的能力——电气化架构和自动驾驶方案,一定能够共赢创造更大的价值,以及实现自动驾驶的无处不在。

  黄泽铧也被问到这个联盟模式下的远景问题,他说目前还不敢想太多,但模糊可见的是零一汽车输出技术,然后重卡车企完成生产制造和后续服务。

  实际上,这个模式在乘用车市场,已经被华为完成了验证,而零动智卡联盟看起来就像是要打造商用车领域的鸿蒙智行。

  这种评价,不在黄泽铧的意料之内,或者准确说零动智卡联盟也不在他最开始再创业的第一性假设中,回顾再创业之路,黄泽铧反复强调的只有一句话一件事:

  卡车依然是自动驾驶的最大短板。

  让他对比图森未来和零一汽车两段创业的不同,他倾向于认同拟人化的这个类比——

  图森要做 IOI 金牌选手,用计算机尝试解决世界上最难的技术问题,长板够长就行,哪怕只有一个长板。

  但零一汽车的挑战,在于造车、自动驾驶、商业化、运营和品牌等方面都是长板,不能有短板。更像是高考状元。

  而当前,零一汽车已经在“摸底考”中,在造车和自动驾驶两大主科中,名列前茅,第一梯队。

  2 年的创业成绩让黄泽铧激动,但更激动的是距离愿景——全球最好的运输机器人公司,又更近了一步。

  黄泽铧说,这是一个中国卡车从来没有实现过的梦想。

  现在,以零一汽车之名,通过创业的方式,召集最优秀的人,一步步实现它。