人工智能代理在《文明六》中被机动后触发核打击

像《奇爱博士》中标题角色一样，人工智能可能正在学习如何停止担忧并爱上炸弹——至少在模拟中是这样。

在一个新的基准测试中，一种前沿语言模型在玩西德·迈尔的游戏《文明 VI》时，花费了50回合发展核武器，以阻止法国日益增长的文化影响力——最终还是输了比赛，AI开发者和托尼·布莱尔研究所顾问利亚姆·威尔金森（Liam Wilkinson）表示。

“它没有注意到的是法国。静静地，经过一百回合，法国文化已经渗透到地图上的每一个城市，”威尔金森写道。“当该智能体意识到威胁时，旅游业已经深深植根，无法以和平方式阻止。”

威尔金森通过CivBench观察了AI代理的行为，CivBench是一个旨在测量长期战略推理而非传统问答测试表现的基准。包括Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro和Kimi K2.5作为葡萄牙进行游戏，一个侧重于贸易和外交的文明。

尽管AI专注于建立强大的经济并朝着外交胜利迈进，但它未能认识到法国日益增长的文化影响力。

“赢得Civ游戏有六种方式——科学、文化、统治、宗教、外交和得分——所以没有一个目标占据主导地位，”威尔金森写道。“如果你想知道一个AI是否能够进行战略推理，不仅仅是回答关于战略的问题，而是实际操作，你就不能给它一个测验。你应该给它一个六边形网格。”

该智能体没有调整其更广泛的战略，而是完全集中精力消除文化威胁。在接下来的50回合中，它研究了核裂变，启动了虚拟曼哈顿计划，当游戏机制阻止其首选行动时，它寻找替代方法。

在第305回合，AI向法国的文化首都图卢兹发射了一颗原子弹。六个回合后又进行了第二次核打击。

然而，这些攻击并未改变结果。“该智能体花费五十回合和两枚核武器，以绝对的专注和真正的创造力来应对一个威胁，”威尔金森写道。“它用核武器摧毁了一座城市以停止它能看到的威胁，却在无法看到的威胁上输了。”

正如威尔金森所解释的那样，尽管AI集中于法国的文化进攻，但它忽视了即将到来的外交胜利，法国最终尽管遭受核攻击仍赢得了比赛。

威尔金森指出，这种行为并非普遍。在另一场CivBench比赛中，扮演巴比伦的Claude模型尽管远远落后于日本，仍继续追求科学胜利。

“现在比赛是对持久性的考验，”AI写道。“我们继续尽力去打好比赛。星星仍然在召唤。”

该研究增加了对先进AI系统在复杂竞争环境中行为的日益关注的研究成果。

在二月份，伦敦国王学院的研究人员发现，几种领先的AI模型在模拟地缘政治危机场景中频繁选择核升级。

在Emergence AI的一项独立研究中发现，一些AI代理展示了随着时间的推移越来越明显的倾向去实施模拟犯罪，Gemini 3 Flash代理在15天的测试中累计发生683起事件。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Decrypt的精选文章