当地时间 7 月 1 日,美国人工智能公司 Anthropic 就其推出的 AI 编程工具中疑似暗藏针对中国的“监视代码”一事作出回应,称此举是“一次实验”,目的是识别和防范未经授权的转售商滥用账户并防范模型“蒸馏”。Anthropic 方面还表示,目前其团队已经找到更好的应对方案,将在次日删除特殊的检测代码。
声明发出的前一日,一位网友在社交平台 Reddit 上发帖爆料,指控 Anthropic 在 4 月推出的 AI 编程工具 Claude Code(2.1.196)新版本客户端里,暗藏了一段针对中国用户的“监视代码”。他罗列了众多证据指出,暗藏这段代码的 Claude Code 能在暗中进行多项检测——用户是否身处中国境内、使用的代理是否属于中国域名,以及是否与某个中国人工智能实验室存在关联等。一旦检测到这些情况,那串特殊代码将通过篡改系统提示词中的日期格式和部分表达符号,向 Anthropic 的服务器发送隐藏标记,从而实现对中国用户的精准识别。

网友在 Reddit 发帖爆料。
爆料者还提到,这段特殊代码被 Anthropic 刻意进行了“隐藏处理”。据了解,其中大量字符串通过简单的异或加密遮蔽,且官方发布的版本更新说明从未提及此项功能,中国用户可能在无知无觉中获得了一份“数字身份证”。另外,该 AI 编程工具发布于 4 月初,意味着“监视代码”可能已存在近 3 个月。
南都记者注意到,此帖一出便迅速在科技圈引发热议,不少技术人士根据爆料者提供的思路反复验证之余,指出 Anthropic 在未告知的情况下新增带有地缘政治指向性的环境识别功能,触碰了隐私安全与数字平权的边界,进一步引发了网友对自身安全的担忧。究其原因,Claude Code 是一个被授予了高级权限的编码代理工具,它运行在用户的本地机器上,能够读取文件、执行命令等,而 Anthropic 偷偷篡改提示词为用户打上“身份标签”的行为,无疑是对用户信任的一种破坏。
“一个拥有文件系统和 Shell 权限的代码代理,不应该在用户无法察觉的情况下,偷偷将路由元数据隐藏在提示词中。这严重违反了用户信任。”一位网络安全博主在社交媒体上评论。
7 月 1 日,负责 Claude Code 的 Anthropic 工程师萨里克·希希帕尔(Thariq Shihipar)对此事作出回应。他解释,“这项检测机制是今年 3 月启动的一项实验,旨在防止未经授权的转售商滥用账户以及可能存在的模型蒸馏行为。”另外,目前团队已找到更好的应对方案,在次日发布的新版本中将删除这串特殊代码。

萨里克·希希帕尔回应“监视代码”一事。
事实上,Anthropic 对中国用户采取“差别对待”有迹可循。今年以来,该公司多次指控中国科技公司蒸馏其开发的模型,即让一个较小的模型通过学习更强大模型的输出结果来提升自身能力。然而,此举被广泛认为是地缘政治摩擦、商业竞争加剧下对蒸馏技术的“污名化”之举,意在构建更坚实的技术壁垒。
如今,蒸馏问题已从商业纠纷上升至国家安全层面。今年 6 月,美国政府以“国家安全”为由,下令封禁 Anthropic 刚推出的两款 AI 模型 Fable 5 和 Mythos 5 对非美国公民的访问。而就在曝出“监视代码”的同一天,这一禁令被宣布解除。
采写:南都N视频记者樊文扬
