
新智元报道
你每天用 Codex、Claude Code 写代码,从没想过一个问题:这份聪明,到底算谁的?
今年 5 月,Meta 给自家工程师划了一道红线。
应用 AI 工程部门的人,不能再随便用 Claude Code 和 Codex 了。

据 The Information 拿到的内部指南,一份备忘录甚至直接要求,暂停某些用到这两个模型的任务。文件措辞很重,说这可能触发「与合作方的严重升级」。
然而,反常也就反常在这儿。
Meta 是 Claude Code 在全球最大的客户之一。它今年内部用 AI 的总账单,正奔着数十亿美元去。
天天离不开的工具,公司花大钱买来,现在却在内部限制使用。而限制的理由,你大概也想不到。
不是它们不好用。恰恰相反,是太好用了。
这条红线
现在仍在生效
据 The Information 报道,这套限制 5 月就定下,至今仍在生效。
Meta 为何如此紧张,这要从它内部一个 AI 编程助手项目说起。
今年,它组建了一个应用 AI 工程团队,主攻自研的 AI 编程助手 MetaCode(原名 DevMate)。
目标就是别再让 Meta 花大价钱继续使用别人的 AI 编程模型,自己也要训一个出来。

Claude Code 官方界面。它与 OpenAI 的 Codex,已是职业开发者做智能体编程的事实标准。
可要练出一个会写代码的模型,没那么简单。
你得喂给它海量高质量数据,还得出足够多、足够刁钻的编程题,让它练手、给它判分。这套题库和评测,几乎决定了一个编程模型最终有多强。
但问题恰恰出在这儿。
Meta 遇到的难题,是怎样才能不让员工太过依赖这些外部工具,去打造内部的替代品。
它所担心的,是这些外部模型的输出渗进训练数据,让自己造的模型,偷偷学了对手的本事。
要看懂这层担心,得先知道一个模型是怎么「学」的:你喂给它什么样的数据,它就长成什么样子。
MetaCode 想变强,靠的就是工程师攒的那套训练数据和编程题库。
可一旦这些题目、答案、甚至判分标准出自 Claude 或 Codex,MetaCode 学到的,就不再是「人类工程师训练出来的本事」,而是「Claude 的本事」。
它照着对手的卷子抄答案,越练越像对手。
更隐蔽的,是评测这一环。
模型每答一道题,得有个东西告诉它答得好不好,它才知道往哪儿改。
如果出题和判分都交给 Codex,那 MetaCode 就是在朝着「Codex 觉得对」的方向进化,等于把对手的判断标准,一点点复刻进了自己脑子里。
这就是为什么,Meta 的这份指南不让 AI 当出题人、判卷人,连「AI 生成的材料能不能进被测模型读得到的环境」都要管。
只要对手的输出有一丝渗进训练或评测的链条,这条「谁教会了谁」的界线,就糊了。
说到底,Meta 暂停部分任务,是在给训练数据做隔离。
怕的是 AI 写得太好,分不清哪些本事是自己训练出来的,哪些是从 Claude 和 Codex 那儿学习来的。
而后面这层能力,是租来的,并不是自己的。
细到让人意外的限制
要先说清楚,Meta 的内部文件里,并没有任何员工真违规的记录。
Meta 发言人也回应,公司有「明确的政策」规范怎么用 AI 工具。所以这份文件,更像是在内部提前拉响警报。
哪些活不能让 AI 碰?主要是以下三类:
第一,不能拿 Claude 或 Codex 的输出,去给自家模型出测试题。指南的原话是,这「明确属于工程师不在驾驶位的范畴」,「我们不要源自模型的任务」。
第二,不能让 AI 在源码里找 bug,也不能让它基于代码分析帮你想「该测什么」。
第三,AI 生成的任何东西,都不能放进被测模型能访问到的地方。
说白了,只要 AI 参与了「该测什么、答得对不对」的判断,对手的本事就可能混进来。三条堵的都是这个口子。
哪些活还能让 AI 干?
搭工作流、整理代码和文件、给内部工具搭测试的架子,这些日常杂活可以。指南把这类工作称作「测试脚手架(test scaffolding)」和「方案校准(solution calibration)」,说白了就是打下手、搭框架。
哪怕是这些活,也有一条铁律:AI 的每一行产出,人都得先过一遍眼。
在 Meta 看来,一旦让对手的模型来出题、判卷,这场考试就说不清是谁考出来的了。
它真正想守住的,就是那条「谁教会了谁」的界线。
绕不开的「蒸馏陷阱」
Meta 担心的这件事,业内有个专门名词:蒸馏(distillation)。
意思不难懂:拿一个更强的模型,让它不停答题,再用这些答案去训练一个较弱的模型。
有点像让学霸把卷子从头做一遍,学渣照着抄,几个月就追上人家好几年的功力。
别人在数据、算力、研究上砸的天价投入,你近乎免费蹭走。
从零训一个前沿模型,烧的钱和时间是天文数字。而蒸馏,可能只要对方一批输出,成本和工期都砍到零头。
蒸馏本身是业界常规操作,大厂也常拿自家大模型蒸馏出更小、更便宜的版本给用户用。
麻烦只在于:一旦你抄的是别人家的模型,你训出来的能力,到底是自己练的,还是顺来的?说不清。
有人把这叫「蒸馏陷阱」:你越是靠最强的模型去搭自己的地基,就越难证明,你的聪明到底打哪来。

在美国,法律并未明文禁止蒸馏,AI 生成的内容也不受版权保护。你拿对方的输出去练自己的模型,法律这一关基本拦不住。
唯一的关卡是合同。
OpenAI、Anthropic 的服务条款都写了类似的限制:不许拿模型的输出,去造一个跟自己竞争的东西。
而且这道关卡,执法权全在竞争对手手里。
去年,Anthropic 就直接掐断了 OpenAI 对 Claude 的接口(API)访问,哪怕 OpenAI 说自己只是拿来评测能力和安全性,是「行业标准」做法。
就连马斯克,也在今年 4 月的一场庭审上被迫承认,他的 xAI「部分」蒸馏过 OpenAI 的模型。

2026 年 4 月 30 日,在加州联邦法院的证人席上,马斯克被问到 xAI 是否对 OpenAI 模型用了蒸馏技术来训练 Grok,他先称这是 AI 公司的普遍做法。
当被追问这是否等于「是」时,他回答是「部分」。
规则模糊,「执法权」都攥在竞争对手手里。谁敢拿自己几十亿的投入,去赌对手不翻脸。
从这个角度看,Meta 的紧张,一点都不多余。
这里,还有一个算盘就是省钱。
按内部备忘录,Meta 今年光内部用 AI 这一项,就要烧掉数十亿美元。它甚至开始给员工的 token 用量设上限。财大气粗如 Meta,也开始嫌 AI 太贵、要精打细算了。
如果能把开发工作从昂贵的外部工具转到自家 MetaCode 上,既省了钱,又躲开了蒸馏的雷,可谓一举两得。
一张走钢丝的地图
关于 Meta 这套内部文件,科技法学者、法律顾问 Mark Leiser 有一句话很形象:这「几乎就是一张走钢丝的地图」。
一边要获得外部模型的好处,一边又得防着它的本事溜进自家系统。
像这样走钢丝的,当然不止 Meta 一家公司,它戳中的是整个行业的命门。
当你用一个足够聪明的 AI,去造另一个同样聪明的 AI,到最后,你可能很难说清:这份聪明,究竟是你自己练出来的,还是从别人的 AI 那儿悄悄学来的。
而且这事,离普通人也没那么远。
你用 AI 写的代码、改的方案、攒的资料,喂回去又会变成下一代模型的养料。
在这个循环中,谁站在谁的肩膀上,那条界线已经变得越来越糊。
当 AI 开始帮我们造 AI,我们还分得清,本事到底是谁的吗?
参考资料:
https://x.com/kimmonismus/status/2071591755351224344
https://www.theinformation.com/articles/internal-docs-show-meta-putting-limits-claude-codex-fearing-distillation
编辑:元宇
