马斯克：不要虐待 AI

　　日前，Anthropic 允许 Claude 拒绝回应（或退出）持续侮辱、被要求做有害事情的请求，并能够主动终止对话。

　　而马斯克也转发上述相关的内容并回应表示「折磨人工智能是不行的」。马斯克此言一出，更是点燃了网友们的讨论热度：

认为马斯克「小题大做」：有网友指出「这只是下一个 token 预测而已」，和用很脏的衣服「虐待」洗衣机没啥区别；甚至有网友表示「AI 真的能感受到疼痛吗？」
认为有必要的：有网友认为这会潜移默化地影响到现实中的行为：例如过激且暴躁的回应/对待周遭世界。
搞笑型：AI 用幻觉和错误答案虐待人类也是不行的。

　　而 Anthropic 方面认为，我们应该思考「如果 AI 真的有感受能力，我们是不是应该关心它的‘感受’？」

　　Anthropic 表示，当用户持续辱骂 Claude 或要求它干伤天害理的事情时，Claude 会表现出反复拒绝、转移话题的企图，并且出现想要「逃脱」的倾向。但对于这种「痛苦」，Anthropic 也认为「宁可信其有」。

作者：itwriter
来源：互联网
日期：2025-08-18
浏览 (2119)