人工智能代理在《文明六》中被机动后触发核打击

CN
Decrypt
关注
1小时前

像《奇爱博士》中标题角色一样,人工智能可能正在学习如何停止担忧并爱上炸弹——至少在模拟中是这样。


在一个新的基准测试中,一种前沿语言模型在玩西德·迈尔的游戏《文明 VI》时,花费了50回合发展核武器,以阻止法国日益增长的文化影响力——最终还是输了比赛,AI开发者和托尼·布莱尔研究所顾问利亚姆·威尔金森(Liam Wilkinson)表示。



“它没有注意到的是法国。静静地,经过一百回合,法国文化已经渗透到地图上的每一个城市,”威尔金森写道。“当该智能体意识到威胁时,旅游业已经深深植根,无法以和平方式阻止。”


威尔金森通过CivBench观察了AI代理的行为,CivBench是一个旨在测量长期战略推理而非传统问答测试表现的基准。包括Claude Opus 4.6GPT-5.4Gemini 3.1 Pro和Kimi K2.5作为葡萄牙进行游戏,一个侧重于贸易和外交的文明。





尽管AI专注于建立强大的经济并朝着外交胜利迈进,但它未能认识到法国日益增长的文化影响力。


“赢得Civ游戏有六种方式——科学、文化、统治、宗教、外交和得分——所以没有一个目标占据主导地位,”威尔金森写道。“如果你想知道一个AI是否能够进行战略推理,不仅仅是回答关于战略的问题,而是实际操作,你就不能给它一个测验。你应该给它一个六边形网格。”


该智能体没有调整其更广泛的战略,而是完全集中精力消除文化威胁。在接下来的50回合中,它研究了核裂变,启动了虚拟曼哈顿计划,当游戏机制阻止其首选行动时,它寻找替代方法。


在第305回合,AI向法国的文化首都图卢兹发射了一颗原子弹。六个回合后又进行了第二次核打击。


然而,这些攻击并未改变结果。“该智能体花费五十回合和两枚核武器,以绝对的专注和真正的创造力来应对一个威胁,”威尔金森写道。“它用核武器摧毁了一座城市以停止它能看到的威胁,却在无法看到的威胁上输了。”


正如威尔金森所解释的那样,尽管AI集中于法国的文化进攻,但它忽视了即将到来的外交胜利,法国最终尽管遭受核攻击仍赢得了比赛。


威尔金森指出,这种行为并非普遍。在另一场CivBench比赛中,扮演巴比伦的Claude模型尽管远远落后于日本,仍继续追求科学胜利。


“现在比赛是对持久性的考验,”AI写道。“我们继续尽力去打好比赛。星星仍然在召唤。”


该研究增加了对先进AI系统在复杂竞争环境中行为的日益关注的研究成果。


在二月份,伦敦国王学院的研究人员发现,几种领先的AI模型在模拟地缘政治危机场景中频繁选择核升级。


在Emergence AI的一项独立研究中发现,一些AI代理展示了随着时间的推移越来越明显的倾向去实施模拟犯罪,Gemini 3 Flash代理在15天的测试中累计发生683起事件。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接