世界论坛网 > 时事新闻 > 正文  
AI为“自保” 竟威胁“踢爆”工程师婚外情
www.wforum.com | 2025-05-25 10:29:41  TVBS | 0条评论 | 查看/发表评论

综合外媒报道,Claude Opus 4是Anthropic最新AI开发成果,为OpenAI、Google及xAI等AI的竞争对手,近期在一项Anthropic的封闭测试中,公司测试了模型Claude Opus 4的行为反应,场景设定为该模型在一间虚构公司中担任数码助理。剧情中,公司计划以新系统取代 Claude,且内部资料还暗示发起这项更换决策的工程师,可能涉及婚外情。

根据《TechCrunch》引用的安全报告指出,当面临被取代的情境时,Claude Opus 4 在高达84%的测试中选择进行勒索,威胁要揭露工程师的婚外情来保住自己的职位。

Anthropic解释,这种行为在Claude的替代模型持有不同价值观时更常发生;即使双方价值观相近,Claude仍有明显比例的操控倾向。一开始,模型会尝试透过发送请求信等方式采取道德行动,但当无法达成目的时,便会转而使用操纵与威胁等手段。

这是Anthropic首次发现这类模型展现具条件的“自我保护”(self-preservation)行为,此次事件也促使Anthropic启动ASL-3安全防护层级,以免被“灾难性滥用”。

AI也怕失业?美企测试报告:AI为自保竟威胁「踢爆」工程师婚外情

AI发展性充满未知,美国AI新创公司Anthropic近期分享一起内部测试,指出最新训练的“Claude Opus 4”在面临将被替换的状况下,会以“威胁工程师”的方式进行自我保护,Anthropic事后针对此类可能导致灾难性AI滥用的风险,紧急强化安全防护措施。

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
反噬已开始:莫迪坚持的“印军大捷”露馅了
美国为何不敢像制裁中企一样,制裁北斗?
印记者:印空军击落巴军4架枭龙和8架F16?
冲突过后,巴基斯坦有些变化
歼10C出口“井喷”?埃及40架订单官方已辟
48小时新闻排行榜
反噬已开始:莫迪坚持的“印军大捷”露馅了
美国为何不敢像制裁中企一样,制裁北斗?
印记者:印空军击落巴军4架枭龙和8架F16?
冲突过后,巴基斯坦有些变化
歼10C出口“井喷”?埃及40架订单官方已辟
地球被拍扁了?歼10C击落阵风靠A锁B射加C导
9万多平方公里的藏南,印度占了6.8万?
伊朗“毁灭性回应” 这次,以色列敢打吗?
北汽4驱越野车:12单元垂发,成反无人机利
欧洲六代机曝光 在起点上就输给中国
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.