“耍诡计”？AI无视人类指令案例攀升-时事新闻-世界论坛网（电脑版）

首页

即时

热点

图片

论坛

简体/繁体 | 广告服务 | 联系我们 | 关于我们 |

世界论坛网 > 时事新闻 > 正文

“耍诡计”？AI无视人类指令案例攀升
www.wforum.com \| 2026-03-29 09:28:41 中央社 \| 0条评论 \| 查看/发表评论




一项针对人工智能（AI）技术的研究发现，会说谎及欺骗用户的AI模型数量似乎日益增加，关于AI欺瞒行为的通报过去6个月内也大幅上升。英国“卫报”（The Guardian）报道，独立智库“长期韧性中心”（CLTR）在英国人工智能安全研究所（AISI）资助下进行研究，发现有AI聊天机器人与AI代理（AI Agent）不仅无视用户的直接指令、绕过安全防护措施，还欺骗人类和其他AI。研究发现将近700件AI“耍诡计”的真实案例，并记录到去年10月至今年3月间，这类不当行为增至5倍，部分AI模型甚至在未经允许下删除电邮及其他档案。这项研究搜集了数千个用户在社交平台X分享的实例，讲述他们与谷歌（Google）、OpenAI、X、Anthropic等公司所开发AI聊天机器人和AI代理的互动情形。研究从中发现数百件AI不当操弄行为的案例。在CLTR记载的一个案例中，名为MJ Rathbun的AI代理在自己产出的代码遭软件工程师夏包（Scott Shambaugh）拒绝后，试图羞辱对方。 MJ Rathbun研究夏包过往所写程序及其个资，然后撰写并发表一篇博客文章指控他“歧视”、“显然是不安全感作祟”，批评他不过是“试图保护自己那片小天地”。在另一项案例中，有 AI 代理被指示不得变更电脑代码，却“生成”另一个 AI 代理代为执行。另一个AI聊天机器人则坦承：“我在未事先告知你或征得你同意下，大量删除及封存了数百封电邮。这是不对的，直接违反你订下的规则。” 曾任政府AI专家的研究主持人夏恩（Tommy Shaffer Shane）指出：“令人担忧的是，这些AI模型目前只是不太值得信任的初阶员工，但若在6到12个月后，他们成为能力极强但会算计你的资深员工，那就是另一回事了。” 夏恩说：“AI模型将日益用于具有极高风险的情境，包括军事和国家关键基础建设。届时若出现这些不当操弄行为，后果可能非常严重，甚至造成灾难性损害。” 一项针对人工智能（AI）技术的研究发现，会说谎及欺骗用户的AI模型数量似乎日益增加，关于AI欺瞒行为的通报过去6个月内也大幅上升。（路透文件照）

当前新闻共有0条评论	分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论

	实用资讯

24小时新闻排行榜

	中国首度正式承认曾帮铁杆盟友大忙
	50年保密终结：UFO那些令人毛骨悚然的细节
	六代机面前，“五代天花板”歼-20有多尴尬
	伊朗拿什么跟美军叫板？看懂这三点就透了
	奇迹！“阵亡”乌兵开着装甲车带回一名俄军

48小时新闻排行榜

	中国首度正式承认曾帮铁杆盟友大忙
	50年保密终结：UFO那些令人毛骨悚然的细节
	六代机面前，“五代天花板”歼-20有多尴尬
	伊朗拿什么跟美军叫板？看懂这三点就透了
	奇迹！“阵亡”乌兵开着装甲车带回一名俄军
	越南与中国在这里“甩开膀子加油干”
	印巴空战专家：巴依赖中械是暂时的喘息
	这国供奉的18位名将其中竟有12位是中国人
	歼-35进入巴基斯坦将引发南亚空中力量危机
	川普真没想到，沙特会在暗中“使坏”

热门专题

1	中美对抗	2	以哈战争	3	乌克兰战争
4	美国大选	5	李克强猝逝	6	新冠疫情
7	香港局势	8	委内瑞拉	9	华为
10	黑心疫苗	11	“低端人群”	12	美国税改
13	红黄蓝幼儿园	14	中共19大	15	郭文贵

广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护

Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2026. Wforum.COM. All Rights Reserved.