国思软件 - 舍弃一键生成路线，比肩 Google 和 Meta，这个国人团队凭何坐稳行业头部？

　　作者｜董道力

　　邮箱｜ dongdaoli@pingwest.com

　　3D 生成大模型公司影眸科技宣布完成新一轮数亿元人民币融资。本轮融资由凯辉基金、上海国投先导领投，老股东持续跟投，光源资本担任独家财务顾问。

　　这笔融资释放的信号不止于资本加码，更折射出 AI 行业价值判断的转向：市场的关注点正从用户规模和概念热度，转向一家公司能否真正嵌入产业工作流、让专业客户持续付费，并把大模型能力沉淀为稳定的商业回报。

　　与融资同步发布的 Hyper3D Rodin Gen-2.5，正是观察这一转向的样本。它要回答的已经不是"AI 能不能生成 3D"，而是"AI 生成的 3D 能不能在专业场景里真正落地"——成为游戏、电商、工业设计、3D 打印、具身智能等领域可编辑、可复用、可交付的数字资产。

　　从“能生成”到“能生产”：3D 生成是要拿来用的

　　AI 3D 的终局，不是生成一个"看起来像"的模型，而是交付一个"拿起来就能用"的资产。

　　过去一段时间，AI 已经能产出不少视觉效果惊艳的 3D 模型。但对专业用户来说，好看只是起点，可用才是门槛。一个模型要进入实际工作流，需要结构稳定、比例准确、材质可用、部件可拆，并支持后续的编辑、降面、烘焙、贴材质。

　　竞争标准也随之改变：从"谁生成得更像"，转向"谁生成得更可控、更可用、更可交付"。

　　与融资同步发布的 Hyper3D Rodin Gen-2.5，正是从几个关键处回应这个问题。

　　首先，它首次将类大语言模型"先思考、再生成"的逻辑引入 3D 领域，让 3D 生成第一次能够面向不同生产场景自适应：生成时间在 4 秒到 80 秒之间可调，面数精度横跨几百面到千万面。

　　Extreme-Low 极速模式 4 秒即可出图，满足快速原型。Extreme-High 思考模式则能完成雕塑级生成，在模型层面还原皮肤微结构、毛孔等细节。这种从"极速出图"到"极致精模"的跨度，意味着同一个模型就能覆盖原本需要多种工具、多个环节才能完成的任务。

　　材质和贴图指向同一方向。这一代推出全球首个分辨率可达 12K 的原生 3D 贴图模型，在生成几何的同时直接生成匹配表面的纹理和材质，支持 360° 全景纹理覆盖与 PBR 物理材质。

　　这决定了模型能否从"可看的白模"变成接近可用的资产，进入对真实感和材质一致性要求更高的下游流程。

　　更能体现"面向生产"取向的，是多项业内独家的可控性功能。Rodin Gen-2.5 支持用自然语言直接修改模型，无需整体重建即可完成语义级编辑。递归分件可将模型自动拆解到部件层级并继续向下细分。配合业内唯一的 3D ControlNet，实现多维度精准可控生成，在相当程度上缓解了"随机抽卡"这一行业难题。

　　可控、可编辑、可应用，本就是 Hyper3D 每一代模型的目标，也正是专业生产与一次性视觉惊艳之间的分界线。

　　实测 Hyper3D Rodin Gen-2.5：速度、精度与可控性的三重变化

　　我们设计了一组测试，分别从速度、精度和可控性三个维度，看看 Hyper3D

　　Rodin Gen-2.5 在实际使用中的表现。

　　2. 1 Thinking Effort：同一个模型，适配不同生产节奏

　　Rodin Gen-2.5 引入了"先思考、再生成"的逻辑，提供从 Extreme-Low 到 Extreme-High 五档模式，生成时间 4 秒到 80 秒不等。直觉上很好理解，概念阶段要快，精模阶段要细，但实际差异到底有多大？我们用同一张图跑了三档，直接看结果。

　　我们采用图生模的方式，输入同一张龙形角色原画，分别用 Extreme-Low、Medium、Extreme-High 三档生成 3D 模型。

　　可以看到除去网页加载延时等，Extreme-Low 模式可以在几秒钟生成模型，虽然细节丢失不少，但整体造型还原图片。Medium 模式中规中矩，比较平衡。而 Extreme-High 虽然生成时间最长，但模型精致，细节都得以保留。

　　测试视频从左到右依次是 Extreme-Low、Medium、Extreme-High 三档，视频 2 倍速

　　我们以游戏行业为例，在游戏正式开发前，都需要进行测试，比如下图是 Rare 于 2018 年推出的《盗贼之海》的原型版本和最终版本。

　　虽然用形状或者重复素材可以测试游戏的运行逻辑，看人物位置等，但视觉效果等肯定不如用真正的游戏中人物，哪怕是低模。这时候 Rodin Gen-2.5 的 Extreme-Low 就能快速完成从原画到模型的转变，拿来快速测试。

　　我们来细看一下 Extreme-High 生成的模型。

　　Rodin Gen-2.5 在模型、而非贴图层面，即可提供雕塑级别的超高细节，能还原龙鳞、龙角、细纹等精细特征，适合追求极致写实的场景。

　　2. 2 全球首个 12K 原生 3D 贴图模型

　　从白模到贴图，是 3D 资产生成里很关键、也很难的一步。几何决定一个模型像不像，贴图决定它能不能真正成立。尤其是复杂生物、角色和道具，轮廓做出来只是第一步，后续还要处理材质分区、纹理连续性、光照一致性和遮挡区域补全。很多模型不是坏在形体，而是坏在贴图跟不上。

　　Rodin Gen-2.5 同步推出全新的原生 3D 外观生成模型。不同于传统多视图投影，它会将参考图中可见的光照、纹理和细节记录到几何表面，并结合模型结构，对未观测区域进行一致性补全。

　　这让贴图不再只是“把图像投到模型上”，而是让外观和三维几何建立更稳定的对应关系。

　　在龙这类复杂资产上，这一点尤其明显。难点不只在轮廓，而在材质是否能跟上几何：鳞片需要保持方向和层次，翼膜需要有薄面纹理和自然明暗，腹甲、尖角、爪部也要呈现不同材质。如果贴图处理不好，翅膀内侧、背部遮挡区和材质交界处很容易出现接缝、拉伸或细节丢失。

　　基于 12K 原生 3D 贴图和 PBR 材质支持，Rodin Gen-2.5 可以在更高分辨率下生成完整表面外观，让鳞片、翼膜、腹甲和角爪在不同视角下保持更一致的视觉表现。

　　另外我们又制作了贴图比较重要的模型复古相机。

　　可以看到，这张复古相机的贴图已经不只是给模型“上色”，而是在建立一套完整的材质关系。金属机身的磨损、划痕和氧化痕迹，让它有了被长期使用过的质感；黑色皮革区域的颗粒纹理，也和冷硬的金属形成了明确区分。镜头部分的玻璃反光、刻度圈和边缘旧化，则进一步把相机从一个白模推进到更接近完整资产的状态。

　　更值得看的是机身上的 RODIN 2.5 和底部编号 YM-1958。这些小字没有完全糊成装饰纹理，而是基本跟随几何表面保持可读。对于这类复古相机来说，真正的难点不只是把外形做出来，而是让金属、皮革、玻璃、橡胶和刻字在同一个模型上彼此区分，又不显得割裂。

　　由于采用了与几何模型一样的 Thinking Effort 设计，该贴图模型的生成时间同样可控，理论最快可以将几何+贴图整个流程压缩到 5 秒。

　　同样的 Extreme-High 相机模型，用最快的思考模式，十秒内就完成贴图。

　　2. 3 可控性：生成之后还能做什么

　　虽然 Rodin Gen-2.5 的重点更新并不围绕可控，但让模型可控是影眸一直在推进的方向。例如，早些上线的 3D Editing 功能，递归分件，和 24 年就有的 3D ControlNet 能力。

　　递归分件

　　在 Hyper3D 中，用户生成模型后可以用 BANG 对其分件，如果一次拆得不够细，还能选中已拆出的部件再拆一次，这就是递归分件。

　　一个模型如果所有结构都粘在一起，就只是"立体图片"，能看，但不好用。动画绑定要知道手臂、关节、轮子各自怎么动，游戏和影视资产要能替换零件、降面、做碰撞体，这些都依赖分件。

　　能不能拆开，往往决定了它是"生成图"还是"生产资产"。

　　3D Editing 局部修改

　　整体满意、但某个局部不对，是 AI 3D 生成的老问题：手不合适、底盘不对、比例差一点。重新生成又回到"抽卡"，打开建模软件手动修又把省下的时间还了回去。

　　Hyper3D 的编辑模式能让用户输入文字指令，AI 会自动框选需要编辑的区域，并局部编辑该模型。生成因此不再是一次性结果，而是可以持续修改、持续推进的资产。不但节省时间，也可以延续了设计时的心流。

　　3D ControlNet（3D 控制可控生成）

　　Hyper3D 上线的 3D ControlNet，支持通过边界框、体素、点云等方式控制生成结果的结构。比如开发者可以用边框盒先定义物体的长宽高和占位比例，再由模型补全细节。模型不只要"生成出来"，还要符合预设的比例、结构和空间关系。

　　这三项能力共同指向同一件事：让 AI 3D 生成从"一次性输出"变成"可控的生产工具"。对专业用户而言，能拆、能改、能控，AI 3D 才算真正从演示走向可用。

　　P3 从 Pro C 到 B 端：实测能力如何转化为商业化路径

　　实测中看到的速度、精度和可控性，最终都要回答一个问题：它们能为谁创造价值，又能换来怎样的回报。技术能力本身并不直接等于商业价值，一项能力能否变成收入，取决于它解决的是不是真实的、有人愿意持续付费的需求。

　　AI 3D 的商业化价值因此落在两点上：哪些用户有稳定的 3D 资产需求，以及他们是否愿意为效率提升持续付费。

　　从这个角度看，影眸没有优先押注泛 C 端流量，而是从 Pro C 和 B 端切入，是一条更务实的路径。

　　普通用户对 3D 模型的需求频次有限，短期尝鲜难以转化为稳定付费。而专业人士本身就处在 3D 资产的生产链条中，对效率、成本和质量更敏感。游戏需要快速原型，电商需要商品 3D 展示，Rodin Gen-2.5 的能力，放在这些场景里才能真正发挥价值。

　　AI 3D 生成只有切实降低这些环节的试错成本，才有机会从"工具尝鲜"变成"工作流的一部分"。

　　从已有数据看，影眸已经跑出了成熟的商业化信号。据公司披露，其海外收入占比约 70%-80%，核心市场在北美，商业模式覆盖平台订阅、B 端 API、私有化部署和最终资产交付。Rodin Gen-2.5 上线首月，订阅用户与 ARR 环比增速均扩大 400%，说明新模型确实释放了需求。

　　客户层面，Hyper3D Rodin 已进入 Unity AI Beta、Nvidia CES 相关工作流、OpenAI 首届 Codex 黑客松冠军作品等场景，并服务于字节跳动、Unity 等 B 端客户。这些案例的意义不止于品牌背书，更代表了四类不同的商业入口：游戏引擎、开发者生态、企业数字化项目和专业资产生产流程。

　　此外，值得关注的是 Pro C 与 B 端之间的转化关系。许多 Pro C 用户本身就在企业流程中工作，个人试用可能进一步转化为团队账号、API 合作或私有化部署。相比靠广告投放获取普通用户，这种自下而上的路径获客效率更高、客户质量更好。

　　换句话说，影眸的商业化逻辑，和它的产品逻辑是同一条：先把专业用户服务好，让能力真正嵌进生产流程，收入自然会从工作流里长出来。

　　AI 3D 生成的竞争，正在从"谁能生成"进入下半场——"谁能进入生产流程、谁能被持续付费"。

　　如果说过去的 AI 3D 生成更多是在证明"技术可行"，那么 Rodin Gen-2.5 想证明的是另一件事：AI 生成的 3D 资产，已经具备进入真实生产流程的条件。Thinking Effort、千万面模型、12K 贴图、可控编辑，这些能力指向同一个目标——让 3D 生成从一次性输出，走向可复用、可修改、可交付的生产资料。

　　这也是影眸科技此轮融资更值得关注的地方。融资提供的是继续研发和扩张市场的资源，但真正决定公司长期价值的，是它能否持续服务专业用户、嵌入更多产业流程，并把 AI 3D 生成变成游戏、电商、工业设计、3D 打印和具身智能等行业真正会用、会买单的基础能力。

舍弃一键生成路线，比肩 Google 和 Meta，这个国人团队凭何坐稳行业头部？

我们的产品

相关链接

关于我们

联系我们