
作者 | 董道力
邮箱 | dongdaoli@pingwest.com
3D 生成大模型公司影眸科技宣布完成新一轮数亿元人民币融资。本轮融资由凯辉基金、上海国投先导领投,老股东持续跟投,光源资本担任独家财务顾问。
这笔融资释放的信号不止于资本加码,更折射出 AI 行业价值判断的转向:市场的关注点正从用户规模和概念热度,转向一家公司能否真正嵌入产业工作流、让专业客户持续付费,并把大模型能力沉淀为稳定的商业回报。
与融资同步发布的 Hyper3D Rodin Gen-2.5,正是观察这一转向的样本。它要回答的已经不是"AI 能不能生成 3D",而是"AI 生成的 3D 能不能在专业场景里真正落地"——成为游戏、电商、工业设计、3D 打印、具身智能等领域可编辑、可复用、可交付的数字资产。
从“能生成”到“能生产”:3D 生成是要拿来用的
AI 3D 的终局,不是生成一个"看起来像"的模型,而是交付一个"拿起来就能用"的资产。
过去一段时间,AI 已经能产出不少视觉效果惊艳的 3D 模型。但对专业用户来说,好看只是起点,可用才是门槛。一个模型要进入实际工作流,需要结构稳定、比例准确、材质可用、部件可拆,并支持后续的编辑、降面、烘焙、贴材质。
竞争标准也随之改变:从"谁生成得更像",转向"谁生成得更可控、更可用、更可交付"。
与融资同步发布的 Hyper3D Rodin Gen-2.5,正是从几个关键处回应这个问题。
首先,它首次将类大语言模型"先思考、再生成"的逻辑引入 3D 领域,让 3D 生成第一次能够面向不同生产场景自适应:生成时间在 4 秒到 80 秒之间可调,面数精度横跨几百面到千万面。
Extreme-Low 极速模式 4 秒即可出图,满足快速原型。Extreme-High 思考模式则能完成雕塑级生成,在模型层面还原皮肤微结构、毛孔等细节。这种从"极速出图"到"极致精模"的跨度,意味着同一个模型就能覆盖原本需要多种工具、多个环节才能完成的任务。
材质和贴图指向同一方向。这一代推出全球首个分辨率可达 12K 的原生 3D 贴图模型,在生成几何的同时直接生成匹配表面的纹理和材质,支持 360° 全景纹理覆盖与 PBR 物理材质。
这决定了模型能否从"可看的白模"变成接近可用的资产,进入对真实感和材质一致性要求更高的下游流程。
更能体现"面向生产"取向的,是多项业内独家的可控性功能。Rodin Gen-2.5 支持用自然语言直接修改模型,无需整体重建即可完成语义级编辑。递归分件可将模型自动拆解到部件层级并继续向下细分。配合业内唯一的 3D ControlNet,实现多维度精准可控生成,在相当程度上缓解了"随机抽卡"这一行业难题。
可控、可编辑、可应用,本就是 Hyper3D 每一代模型的目标,也正是专业生产与一次性视觉惊艳之间的分界线。
实测 Hyper3D Rodin Gen-2.5:速度、精度与可控性的三重变化
我们设计了一组测试,分别从速度、精度和可控性三个维度,看看 Hyper3D
Rodin Gen-2.5 在实际使用中的表现。
2. 1 Thinking Effort:同一个模型,适配不同生产节奏
Rodin Gen-2.5 引入了"先思考、再生成"的逻辑,提供从 Extreme-Low 到 Extreme-High 五档模式,生成时间 4 秒到 80 秒不等。直觉上很好理解,概念阶段要快,精模阶段要细,但实际差异到底有多大?我们用同一张图跑了三档,直接看结果。

我们采用图生模的方式,输入同一张龙形角色原画,分别用 Extreme-Low、Medium、Extreme-High 三档生成 3D 模型。

可以看到除去网页加载延时等,Extreme-Low 模式可以在几秒钟生成模型,虽然细节丢失不少,但整体造型还原图片。Medium 模式中规中矩,比较平衡。而 Extreme-High 虽然生成时间最长,但模型精致,细节都得以保留。
测试视频从左到右依次是 Extreme-Low、Medium、Extreme-High 三档,视频 2 倍速
我们以游戏行业为例,在游戏正式开发前,都需要进行测试,比如下图是 Rare 于 2018 年推出的《盗贼之海》的原型版本和最终版本。
虽然用形状或者重复素材可以测试游戏的运行逻辑,看人物位置等,但视觉效果等肯定不如用真正的游戏中人物,哪怕是低模。这时候 Rodin Gen-2.5 的 Extreme-Low 就能快速完成从原画到模型的转变,拿来快速测试。

我们来细看一下 Extreme-High 生成的模型。

Rodin Gen-2.5 在模型、而非贴图层面,即可提供雕塑级别的超高细节,能还原龙鳞、龙角、细纹等精细特征,适合追求极致写实的场景。
2. 2 全球首个 12K 原生 3D 贴图模型
从白模到贴图,是 3D 资产生成里很关键、也很难的一步。几何决定一个模型像不像,贴图决定它能不能真正成立。尤其是复杂生物、角色和道具,轮廓做出来只是第一步,后续还要处理材质分区、纹理连续性、光照一致性和遮挡区域补全。很多模型不是坏在形体,而是坏在贴图跟不上。
Rodin Gen-2.5 同步推出全新的原生 3D 外观生成模型。不同于传统多视图投影,它会将参考图中可见的光照、纹理和细节记录到几何表面,并结合模型结构,对未观测区域进行一致性补全。
这让贴图不再只是“把图像投到模型上”,而是让外观和三维几何建立更稳定的对应关系。
在龙这类复杂资产上,这一点尤其明显。难点不只在轮廓,而在材质是否能跟上几何:鳞片需要保持方向和层次,翼膜需要有薄面纹理和自然明暗,腹甲、尖角、爪部也要呈现不同材质。如果贴图处理不好,翅膀内侧、背部遮挡区和材质交界处很容易出现接缝、拉伸或细节丢失。
基于 12K 原生 3D 贴图和 PBR 材质支持,Rodin Gen-2.5 可以在更高分辨率下生成完整表面外观,让鳞片、翼膜、腹甲和角爪在不同视角下保持更一致的视觉表现。
另外我们又制作了贴图比较重要的模型复古相机。

可以看到,这张复古相机的贴图已经不只是给模型“上色”,而是在建立一套完整的材质关系。金属机身的磨损、划痕和氧化痕迹,让它有了被长期使用过的质感;黑色皮革区域的颗粒纹理,也和冷硬的金属形成了明确区分。镜头部分的玻璃反光、刻度圈和边缘旧化,则进一步把相机从一个白模推进到更接近完整资产的状态。
更值得看的是机身上的 RODIN 2.5 和底部编号 YM-1958。这些小字没有完全糊成装饰纹理,而是基本跟随几何表面保持可读。对于这类复古相机来说,真正的难点不只是把外形做出来,而是让金属、皮革、玻璃、橡胶和刻字在同一个模型上彼此区分,又不显得割裂。
由于采用了与几何模型一样的 Thinking Effort 设计,该贴图模型的生成时间同样可控,理论最快可以将几何+贴图整个流程压缩到 5 秒。
同样的 Extreme-High 相机模型,用最快的思考模式,十秒内就完成贴图。
2. 3 可控性:生成之后还能做什么
虽然 Rodin Gen-2.5 的重点更新并不围绕可控,但让模型可控是影眸一直在推进的方向。例如,早些上线的 3D Editing 功能,递归分件,和 24 年就有的 3D ControlNet 能力。
递归分件
在 Hyper3D 中,用户生成模型后可以用 BANG 对其分件,如果一次拆得不够细,还能选中已拆出的部件再拆一次,这就是递归分件。
一个模型如果所有结构都粘在一起,就只是"立体图片",能看,但不好用。动画绑定要知道手臂、关节、轮子各自怎么动,游戏和影视资产要能替换零件、降面、做碰撞体,这些都依赖分件。
能不能拆开,往往决定了它是"生成图"还是"生产资产"。
3D Editing 局部修改
整体满意、但某个局部不对,是 AI 3D 生成的老问题:手不合适、底盘不对、比例差一点。重新生成又回到"抽卡",打开建模软件手动修又把省下的时间还了回去。
Hyper3D 的编辑模式能让用户输入文字指令,AI 会自动框选需要编辑的区域,并局部编辑该模型。生成因此不再是一次性结果,而是可以持续修改、持续推进的资产。不但节省时间,也可以延续了设计时的心流。

3D ControlNet(3D 控制可控生成)
Hyper3D 上线的 3D ControlNet,支持通过边界框、体素、点云等方式控制生成结果的结构。比如开发者可以用边框盒先定义物体的长宽高和占位比例,再由模型补全细节。模型不只要"生成出来",还要符合预设的比例、结构和空间关系。

这三项能力共同指向同一件事:让 AI 3D 生成从"一次性输出"变成"可控的生产工具"。对专业用户而言,能拆、能改、能控,AI 3D 才算真正从演示走向可用。
P3 从 Pro C 到 B 端:实测能力如何转化为商业化路径
实测中看到的速度、精度和可控性,最终都要回答一个问题:它们能为谁创造价值,又能换来怎样的回报。技术能力本身并不直接等于商业价值,一项能力能否变成收入,取决于它解决的是不是真实的、有人愿意持续付费的需求。
AI 3D 的商业化价值因此落在两点上:哪些用户有稳定的 3D 资产需求,以及他们是否愿意为效率提升持续付费。
从这个角度看,影眸没有优先押注泛 C 端流量,而是从 Pro C 和 B 端切入,是一条更务实的路径。
普通用户对 3D 模型的需求频次有限,短期尝鲜难以转化为稳定付费。而专业人士本身就处在 3D 资产的生产链条中,对效率、成本和质量更敏感。游戏需要快速原型,电商需要商品 3D 展示,Rodin Gen-2.5 的能力,放在这些场景里才能真正发挥价值。
AI 3D 生成只有切实降低这些环节的试错成本,才有机会从"工具尝鲜"变成"工作流的一部分"。
从已有数据看,影眸已经跑出了成熟的商业化信号。据公司披露,其海外收入占比约 70%-80%,核心市场在北美,商业模式覆盖平台订阅、B 端 API、私有化部署和最终资产交付。Rodin Gen-2.5 上线首月,订阅用户与 ARR 环比增速均扩大 400%,说明新模型确实释放了需求。
客户层面,Hyper3D Rodin 已进入 Unity AI Beta、Nvidia CES 相关工作流、OpenAI 首届 Codex 黑客松冠军作品等场景,并服务于字节跳动、Unity 等 B 端客户。这些案例的意义不止于品牌背书,更代表了四类不同的商业入口:游戏引擎、开发者生态、企业数字化项目和专业资产生产流程。
此外,值得关注的是 Pro C 与 B 端之间的转化关系。许多 Pro C 用户本身就在企业流程中工作,个人试用可能进一步转化为团队账号、API 合作或私有化部署。相比靠广告投放获取普通用户,这种自下而上的路径获客效率更高、客户质量更好。
换句话说,影眸的商业化逻辑,和它的产品逻辑是同一条:先把专业用户服务好,让能力真正嵌进生产流程,收入自然会从工作流里长出来。
1
AI 3D 生成的竞争,正在从"谁能生成"进入下半场——"谁能进入生产流程、谁能被持续付费"。
如果说过去的 AI 3D 生成更多是在证明"技术可行",那么 Rodin Gen-2.5 想证明的是另一件事:AI 生成的 3D 资产,已经具备进入真实生产流程的条件。Thinking Effort、千万面模型、12K 贴图、可控编辑,这些能力指向同一个目标——让 3D 生成从一次性输出,走向可复用、可修改、可交付的生产资料。
这也是影眸科技此轮融资更值得关注的地方。融资提供的是继续研发和扩张市场的资源,但真正决定公司长期价值的,是它能否持续服务专业用户、嵌入更多产业流程,并把 AI 3D 生成变成游戏、电商、工业设计、3D 打印和具身智能等行业真正会用、会买单的基础能力。

