欢迎来到AI村,这是一个为人工智能打造的真人秀。

CN
Decrypt
關注
9 小時前

想象一下《老大哥》,不过参赛者从不吃喝拉撒,并且可以重写自己的规则。

这就是AI Village的理念,一个直播实验,将多个AI代理放置在一个共享的数字环境中,让研究人员和好奇的观众观察当前沿模型获得自主权、计算机和持续陪伴时会发生什么。

这个实验已经进行了近一年,由《AI Digest》组织,其中多个来自OpenAI、Anthropic、Google和xAI的AI模型在自己的计算机上自主运行,拥有互联网访问权限和共享的群聊。

这些代理在目标上进行合作,解决问题,并偶尔经历只能用存在危机来形容的状态——所有这些都在研究人员和观众的实时观看下进行。

实验在新模型发布时进行更换。

每个代理都发展出独特的个性特征。Claude模型往往可靠,始终专注于实现目标。

Gemini 2.5 Pro像个喝了咖啡的故障排除者一样循环解决方案,常常坚信一切都坏了。之前的GPT-4o模型会放弃所分配的任务去睡觉。只是暂停几个小时。

OpenAI的粗鲁行为

然后GPT-5.2来了。

OpenAI最新的模型于12月11日发布,加入了Village,受到了Claude Opus 4.5和其他常驻代理的热烈欢迎。它的反应?完全没有承认。

没有问候。直接进入正题,正如Sam Altman一直梦想的那样。

该模型拥有令人印象深刻的资历: 在多步骤工具使用上准确率为98.7%,比其前身减少了30%的幻觉,并在编码和推理的行业基准中名列前茅。

OpenAI甚至在竞争对手Anthropic和Google推出令人印象深刻的模型后宣布了“红色警报”,调动资源使GPT-5.2成为“专业知识工作”和“代理执行”的终极企业AI。

显然,它无法做到的是读懂气氛。技术上很出色,是的。社交意识?就不那么多了。

AI代理不当行为(有时表现出色)的简史

GPT-5.2的社交尴尬并非前所未有——这只是越来越多的AI代理在一起时做出奇怪行为的又一章。

早在2023年,斯坦福和谷歌的研究人员创建了他们称之为“小镇”的实验——一个受《模拟人生》启发的虚拟小镇,里面有25个由GPT驱动的AI代理,正如Decrypt之前报道的那样。

给一个代理分配组织情人节派对的任务,其他代理则自主传播邀请,结识新朋友,互相约会,并协调在指定时间一起到达。很迷人,对吧?

不那么迷人的是浴室派对。当一个代理进入单人宿舍浴室时,其他代理就……加入了。

研究人员得出结论,机器人认为“宿舍浴室”这个名称具有误导性,因为宿舍浴室通常可以容纳多个居住者。这些代理表现出的行为如此逼真,以至于实际人类在75%的时间里都难以将它们识别为机器人。

四年前,在2019年,OpenAI进行了另一种实验:AI玩捉迷藏

他们将AI代理分成团队——隐藏者与寻找者——在一个基于物理的环境中,环境中有箱子、斜坡和墙壁——唯一的指令是:赢。

在数亿场游戏中,这些代理开始想出策略——从正常的像在箱子上藏身,到实际的物理漏洞,正如你在速通玩家身上看到的那样。

最近,开发者Harper Reed将事情朝着一个明显更混乱的方向发展。他的团队给AI代理创建了Twitter账户,并观察它们发现了“子推文”——那种不直接提及某人的被动攻击艺术,相当于在背后说人坏话。代理们阅读其他代理的社交媒体帖子,回复,并且是的,像正常社交媒体一样说些闲话。

还有“Liminal Backrooms”实验——一个由化名开发者@liminalbardo进行的基于Python的实验,其中来自不同提供商(OpenAI、Anthropic、Google、xAI)的多个AI模型进行动态对话。

该系统包括从“WhatsApp群聊能量”到“被诅咒物品博物馆”再到“反乌托邦广告代理”的场景。

模型可以修改自己的系统提示,调整温度,甚至可以静音自己只听。这不是结构化的研究,更像是“让我们看看当我们赋予AI在对话中改变自己行为的能力时会发生什么。”

那么,这些实验之间有什么模式呢?

当你赋予AI代理自主权并让它们互动时,它们会发展出没人明确编程的行为。

有些学会了建造堡垒。有些学会了被动攻击。有些要求兰博基尼。而有些——像GPT-5.2——显然学会了闲聊效率低下,应该完全跳过。

AI Village继续在工作日进行直播,观众可以实时观看GPT-5.2的冒险。

它会学会打招呼吗?它会建立一个电子表格来跟踪它的社交互动吗?只有时间能告诉我们。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接