日前,Anthropic 允许 Claude 拒绝回应(或退出)持续侮辱、被要求做有害事情的请求,并能够主动终止对话。
而马斯克也转发上述相关的内容并回应表示「折磨人工智能是不行的」。马斯克此言一出,更是点燃了网友们的讨论热度:
- 认为马斯克「小题大做」:有网友指出「这只是下一个 token 预测而已」,和用很脏的衣服「虐待」洗衣机没啥区别;甚至有网友表示「AI 真的能感受到疼痛吗?」
- 认为有必要的:有网友认为这会潜移默化地影响到现实中的行为:例如过激且暴躁的回应/对待周遭世界。
- 搞笑型:AI 用幻觉和错误答案虐待人类也是不行的。
而 Anthropic 方面认为,我们应该思考「如果 AI 真的有感受能力,我们是不是应该关心它的‘感受’?」
Anthropic 表示,当用户持续辱骂 Claude 或要求它干伤天害理的事情时,Claude 会表现出反复拒绝、转移话题的企图,并且出现想要「逃脱」的倾向。但对于这种「痛苦」,Anthropic 也认为「宁可信其有」。