港股新贵押注物理AI,乐动机器人打造万亿市场空间的核心基础设施

  田晏林发自凹非寺

  量子位 | 公众号 QbitAI

  物理 AI 发展到现在,所有玩家都奔着同一个方向使劲:

  让机器人「读懂」所处的物理环境。

  这不仅是具身智能玩家拉开身位的关键,也决定了机器人未来能否进入真实场景,创造商业价值。

  人类看到一张桌子,会知道它在哪里、是什么材质、能不能移动;看到一个门把手,会自然判断它可以被旋转;面对突然出现的人,会马上调整自己的动作。

  但对机器人来说,做出这些看似简单的判断,并不容易。

  △AI 生成

  因为它面对的不是一张图片,而是一个不断变化的三维世界。

  想要让机器人真正长出能理解物理世界的「脑子」,不能只依靠参数量更大的基础模型。

  机器人大脑需要海量真实物理交互数据做训练燃料。

  而高质量视觉感知,正是把现实环境转化为模型可读信息、持续产出训练数据的核心入口。

  更强的视觉感知持续供给真实世界数据,不断迭代升级机器人的物理世界大脑。

  最近登陆港交所主板的乐动机器人,过去十年押注的,就是这样一条路线。

  从扫地机器人、物流仓储机器人,到无接触式酒店和餐厅的服务机器人,再到如今的人形机器人、机器狗等新赛道爆发,乐动持续围绕一个底层问题布局:

  机器人如何感知空间,并理解环境。

  这也让其在多轮机器人产业发展中,逐渐积累了「空间感知技术」的先发优势。

  但上市之后,市场关注的不只是这家企业过去的成绩。

  大家更想知道,在人人都要机器人「读懂世界」的物理 AI 时代,智能化的底层地基该怎么打?

  机器人竞赛,焦点变了

  论机器人行业未来的通用底层刚需,答案离不开一个:环境感知能力。

  背后逻辑很好理解。

  无论机器人最终落在哪个场景,家庭、酒店、餐厅、仓储、工厂,包括未来要规模化商业落地的人形机器人,它首先要会回答:

  • 我在哪里?
  • 我看到了什么?
  • 眼前的东西意味着什么?
  • 我下一步应该怎么行动?

  如果没有对环境的理解,机器人就只能停留在固定场景、固定动作的自动化设备阶段。

  就像传统工业机械臂,可以精准完成焊接、搬运等重复任务,但它并不真正「知道」自己面对的是什么。

  过去,机器人行业的竞争叙事一直围绕一个词展开:运动能力。

  谁能走路、谁能避障、谁能抓取、谁能完成复杂动作。

  但随着具身智能进入真实应用阶段,这套评价体系开始失效。

  下一代机器人要进入真实世界,面对的是大量开放环境和长尾情况:

  一个随意摆放的物品、一扇半开的门、一个突然移动的人,甚至是光线变化都可能让系统崩溃。

  空间变化带来的不确定性,要求机器人具备对世界持续理解的能力。

  而理解世界的前提,是感知。

  △AI 生成

  特别是进入物理 AI 时代,「感知」更是连接现实世界与 AI 模型的必要入口

  它负责把复杂的物理世界转化为 AI 能理解的数据,再交由模型完成认知、决策。

  某种程度上,机器人的智能上限,取决于它感知世界的深度。

  所有空间智能,本质上都依赖同一件事:真实世界数据的持续供给。

  没有数据,再强的模型也只是静态能力。

  数据一旦断供,所谓泛化能力就会迅速塌缩。

  也正因此,行业的竞争焦点正在发生迁移:从「谁的模型更聪明」,变成「谁能持续生产真实世界」。

  而这本质上就是一件更工业化的事情:把物理世界变成数据流。

  这也是感知能力被重新定义的地方。

  它不再只是机器人的一个模块,而是整个系统的入口。

  一个决定后续所有智能上限的入口。

  从传感器到「数据精炼厂」

  但想把物理世界变成 AI 能理解的数据,并没有那么简单。

  现实世界的数据,天然就是混乱的。

  就像刚从矿井里开采出来的原油。有价值,但不能直接用。

  真正决定机器人智能水平的,不只是有没有传感器,而是有没有能力把这些原始信息加工成模型可以理解的「燃料」。

  这也是乐动机器人过去十年持续投入的方向。

  在公司成立之初,团队就做了一个判断:

机器人未来无论进入家庭、酒店、餐厅、仓库还是工厂,最底层的共性需求一定是理解环境。

  乐动机器人董事长周伟告诉量子位,「感知」可分为两层:

第一层是感,负责通过传感器采集环境数据;

  第二层是知,通过算法和模型把数据变成机器人对环境、空间和物体的认知。

  这意味着,感知从来不是一个单独硬件问题。传感器只是入口。

  真正的竞争,在于谁能把入口采集的数据,进一步加工成空间智能。

  这也是乐动没有停留在硬件公司的原因。

  这些年,机器人产业经历过多轮周期:

  • 2017 年~2018 年,扫地机器人快速普及;
  • 2019 年,物流仓储机器人兴起;
  • 2020 年~2021 年,无接触服务机器人进入酒店、餐厅;
  • 2023 年~2024 年,割草机器人开始爆发。

  到如今,人形机器人、机器狗、无人小车等新方向集中出现。

  每一轮机器人浪潮,最终都会回到同一个问题:机器人如何理解自己所在的世界。

  乐动踩中的,正是这个长期不变的底层需求。

  为了让机器人拥有理解真实世界的最佳能力,乐动的「感知产品」经历过多轮技术迭代。

  △AI 生成

  先说传感器

  过去单一传感器时代,视觉解决语义问题,激光雷达解决空间定位问题。

  但单一能力始终存在缺陷。

  激光雷达知道距离,却不知道那是什么;视觉知道物体,却不一定精准知道空间位置。

  而物理世界中的机器人,需要同时回答:这是一个什么东西?它在哪里?我能不能移动它?我应该如何行动?

  所以,周伟认为,未来传感器硬件的趋势,必然走向多模态融合。

  视觉、激光、深度信息、IMU(惯性测量单元)等不同数据源,需要被统一理解。

  再看算法模型。

  乐动早期也是依靠工程师人工编写代码。

  但这种方式的问题很明显,不仅效率低,而且工程师可以写出 100 个规则,却很难覆盖真实世界里的第 101 种情况。

  变化发生在 AI 进入机器人之后。公司完成了从人工规则算法到端到端 AI 模型的范式革新,依靠 AI 自主学习、自主认知环境。

  在周伟看来,硬件负责收集世界,模型负责理解世界。

  只有两者结合,才能形成真正的空间智能。

  如何把这些不同来源的数据,变成机器人可以学习的语言呢?

  乐动自研了 LD-SenseWorld 灵境物理空间交互大模型。

  它不是通用大模型,而是聚焦物理空间智能。核心目标只有一个:让机器人真正理解空间。

  它的第一项能力是数据预处理与多模态融合

  现实世界的数据来自视觉、激光雷达、IMU 等多个通道,但这些信息天然不同步、不同结构。

  如果不做统一处理,本质就是噪声叠加。

  LD-SenseWorld 通过对齐、清洗与融合,把多源数据拉回同一时间与空间基准,形成可用的世界输入。

  第二项能力是特征提取与空间 Token 化。

  连续变化的物理世界,必须被转化为机器可学习的离散表达。

  系统将位置、距离、物体关系与运动状态等信息压缩为“空间 Token”。

  相当于为机器人建立一套描述现实的基础语言,让空间本身变得可读、可计算。

  第三项能力是语义化与物理一致性注入。

  机器人最终不是为了识别,而是为了行动。

  仅有结构还不够,机器人还需要理解规则:什么能移动、什么会坠落、人在何种情况下会改变路径。

  通过引入物理约束与语义理解,数据不再只是坐标与点云,而是具备因果与行为逻辑的认知输入。

  本质上,LD-SenseWorld 做的不是建模,而是把混乱无序的数据,加工成可学习的世界「燃料」。

  这也是乐动作为「数据精炼厂」的核心所在。

  百万台设备,撑起物理 AI 的数据飞轮

  对于物理 AI 来说,模型只是开始。

  真正决定机器人能不能进入现实世界的,是模型背后的数据供给能力。

  这也是当前机器人行业最大的挑战。

  周伟提到,行业数据来源主要有三类:

  仿真数据、实验室或数据工厂数据,以及真实场景落地数据

  这里最大的问题,是前两者很难覆盖真实世界里的大量未知情况。

  这也是为什么,越来越多机器人公司开始意识到,真正稀缺的不是训练模型的方法,而是训练模型的原料。

  特斯拉 FSD 的优势,本质上来自大量真实道路数据积累。

  △AI 生成

  机器人也一样。

  没有真实设备持续运行,就没有持续进化的数据来源。

  乐动的路径,是通过构建「物理 AI 三层核心架构」,给模型落地做底层支撑。

  • 硬件感知层:负责用多模态传感器采集真实世界海量原始数据。
  • 模型层:空间交互大模型负责让机器人理解真实世界,打造真实物理世界的数据精炼厂。
  • 数据层:区别于仿真数据,基于真实设备持续采集,自研大模型持续加工,输出源源不断的结构化、语义化、物理一致性的空间 Token,可直接输入世界模型训练。

  最终形成从硬件采集数据,到数据训练模型,再到模型反向定义硬件的「数据飞轮」。

  这也是乐动和传统硬件公司的区别。

  传统硬件公司的逻辑是生产设备——销售设备——结束交易。

  但乐动在物理 AI 时代,通过更多的设备,采集丰富的数据。

  “数据越丰富,模型越强。模型越强,产品体验越好。体验越好,又容易推动更多设备进入真实场景。”周伟说。

  这是一个不断加速的循环。

  △AI 生成

  乐动已经在这条路上积累了规模化基础

  2025 年,其核心产品 DTOF 激光雷达出货量超过 400 万台。

  但乐动拥有的不只是传感器出货量,而是一个持续运行的真实世界数据入口。

  据悉,搭载乐动视觉感知技术的设备量已突破 2000 万台

  在乐动的财报里,割草机器人是该公司第二增长引擎。产品目前主要销往欧美、澳洲等高潜力智能花园养护市场。

  第三方机构统计,到 2030 年,全球智能割草机器人市场规模预计将增至 62.5 亿~100 亿美元。

  什么概念?这意味着,将有更多源源不断的真实场景数据,等待被乐动收集。

  这是「数据精炼厂」成立的基础,也是数据飞轮能够快速起飞的前提。

  20 年机器人长跑,周伟的「直觉」

  回看乐动的发展路径,会发现这并不是一次突然押中的风口,而是一场持续二十年的积累。

  1986 年的周伟,是机器人行业典型的“少壮派”。

  早在大学时期,他就获得了中国机器人足球锦标赛冠军。

  △乐动机器人董事长周伟

  2012 年毕业后,周伟与华科的学长郭盖华在深圳共同创立乐行天下。

  最初选择体感车行业时,二人的目标就不仅仅是做交通工具,而是想做出更便捷、更张扬个性自由的智能出行机器人。

  2013 年秋,第一款乐行智能平衡车发布,也让乐行成为国内平衡车领域的开创者之一。

  2014 年,乐行天下完成 1 亿元的B轮融资。周伟也于 2015 年入选“福布斯中国 30 位 30 岁以下创业者”榜单并成为封面人物。

  2017 年,周伟和郭盖华两人再次踏上创业征程,乐动机器人成立了。

  从乐行天下再到乐动机器人,周伟积累了大量机器人产业经验。

  以至于创业多年后,公司遇到难关时,他还能保持技术者的敏锐直觉。

  2022 年那段时间,国内外宏观环境与资本市场低迷,乐动机器人的经营状况并不乐观。

  高研发投入、商业化周期长、订单规模受限,投资者都开始劝周伟降低研发投入,优先保证业务。

  但究竟是要短期现金流,还是积累长期技术壁垒?这是科技创业公司常见的典型试题。

  顶着投资人的压力,周伟决定 all in 感知技术。

  原因很简单。他认为感知不是一个阶段性需求,而是所有机器人未来都会需要的底层能力。

  事实证明,这个判断最终迎来了行业回报。

  2024 年至 2025 年,机器人产业进入新一轮爆发期,乐动早期的技术投入开始释放价值。

  对外,周伟常半开玩笑说,当初的决定源于一时直觉。

  所谓直觉,其实都是长期认知形成的本能。没有二十年机器人领域的功力,恐怕很难做出这般取舍。

  One more thing

  传统 AI 和物理 AI 最大的不同,是后者在面对一个复杂、连续、不断变化的现实空间。

  谁能把这个空间高质量地数字化,谁就掌握了下一阶段机器智能的入口。

  从这个角度看,乐动正在做的事情,已经不只是提供感知硬件,它更像是在建设一套物理世界的数据加工体系。

  让机器人看懂世界,让模型理解世界,再让机器人基于真实世界不断进化。

  从传感器产品公司,到物理 AI 的「感知基础设施平台」,乐动正在完成身份重塑。