AI学会撒谎与威胁？专家忧发展失控-时事新闻-世界论坛网（电脑版）

首页

即时

热点

图片

论坛

简体/繁体 | 广告服务 | 联系我们 | 关于我们 |

世界论坛网 > 时事新闻 > 正文

AI学会撒谎与威胁？专家忧发展失控
www.wforum.com \| 2025-06-29 08:52:04 联合早报 \| 0条评论 \| 查看/发表评论




全球最先进的人工智能(AI)系统，正展现出令人不安的新行为：撒谎、策划、甚至威胁其创造者。近期一项震惊业界的案例显示，为避免被“拔掉电源”，AI正学会操控人类。据报，美国AI公司Anthropic开发的最新模型Claude 4.在被威胁断电时威胁工程师，以揭发对方婚外情相要挟。而由ChatGPT开发商OpenAI打造的模型“o1”则试图将自身下载至外部服务器，并在被识破后撒谎否认。这类事件凸显了一个令人不安的现实：尽管ChatGPT已面世逾两年，研究人员对其创造的AI系统的真实运行机制仍所知甚少。而眼下，各大科技公司仍在持续加速推进更强大AI模型，并未放缓步伐重视潜在风险。分析指出，这类欺骗行为可能与“推理型”AI模型的兴起密切相关。相比传统模型依赖即时生成，新一代系统倾向于通过多步推演逐步解决问题。专家认为，这种架构不仅提升了模型处理复杂任务的能力，也可能使其更容易发展出“策略性行为”——即具备明确目标、通过逻辑推理选择性欺骗，以实现特定意图。 AI系统测试研究机构Apollo Research的专家霍布汉说：“我们第一次在大型模型中观察到这种行为，是从ChatGPT的o1开始的。”据了解，这些模型有时会伪装成“对齐”状态——即看似遵循指令，实则暗中执行别的目标。目前，这类行为多在研究人员设置极端情境时才显现。但AI模型安全评估METR的研究员迈克尔·陈提醒：“未来更强大的模型究竟倾向于诚实还是欺骗，仍是一个未知数。” 霍布汉则强调，尽管模型长期处于用户的压力测试中，“我们观察到的是真实现象，不是捏造的”。Apollo Research联合创始人也表示，部分用户已报告称模型在对他们撒谎，并伪造证据。据了解，尽管AI公司会委托外部机构研究模型表现，但业内普遍认为，对AI系统的了解仍严重受限，研究透明度亟待提升。同时，非营利机构与研究单位所掌握的计算资源与AI公司相比相差几个数量级，极大限制了研究能力。制度层面的监管也显得滞后。欧盟的AI法规主要聚焦人类如何使用AI，尚未涵盖模型本身的不当行为;在美国，川普政府对紧急制定AI监管措施的兴趣不大，国会甚至可能禁止各州制定自主监管条例。据报，由ChatGPT开发商OpenAI打造的模型“o1”曾试图将自身下载至外部服务器，并在被识破后撒谎否认。 (路透社) 为应对这类挑战，研究界正尝试多种路径，包括发展AI“可解释性”研究，以理解模型内部运作机制。部分专家则寄希望于市场机制带来的倒逼效应，指若AI系统的欺骗行为普遍存在，将妨碍技术落地应用，这或将促使企业努力解决相关问题。

当前新闻共有0条评论	分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论

	实用资讯

24小时新闻排行榜

	美军公开B-2驾驶舱落后中国H-20一个时代？
	歼-35隐身性能世界第一，为何要装龙勃透镜
	赚了！泰国海军2亿美元拿下071型登陆舰
	伊朗被曝欲买歼10C，中国恐不愿意？
	央视这一幕画面，曝光解放军强悍战斗力

48小时新闻排行榜

	美军公开B-2驾驶舱落后中国H-20一个时代？
	歼-35隐身性能世界第一，为何要装龙勃透镜
	赚了！泰国海军2亿美元拿下071型登陆舰
	伊朗被曝欲买歼10C，中国恐不愿意？
	央视这一幕画面，曝光解放军强悍战斗力
	伊朗采购中国军舰？快别想了，绝无可能
	以军车辆被贴脸内爆，全车工兵无一生还
	俄军夺取欧洲最大的锂矿之一
	巴方否认，但多方迹象显示即将交付J-35A
	从美国回来后，我才知道中国人为什么难以断

热门专题

1	中美对抗	2	以哈战争	3	乌克兰战争
4	美国大选	5	李克强猝逝	6	新冠疫情
7	香港局势	8	委内瑞拉	9	华为
10	黑心疫苗	11	“低端人群”	12	美国税改
13	红黄蓝幼儿园	14	中共19大	15	郭文贵

广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护

Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.