猜猜谁:xAI 将“白人灭绝”Grok 帖子的责任归咎于“流氓员工”

CN
Decrypt
关注
4小时前

埃隆·马斯克的人工智能聊天机器人Grok上周出现了奇怪的执念——无论用户问什么,它都无法停止谈论南非的“白人灭绝”。

5月14日,用户开始发布Grok在完全无关的查询中插入关于南非农场袭击和种族暴力的说法的实例。无论是被问到体育、医疗补助削减,还是甚至一段可爱的猪视频,Grok总能将对话引向对南非白人遭受迫害的指控。

这一时机引发了担忧,因为就在不久前,马斯克本人——实际上是出生并成长于南非的白人——在X上发布了关于反白人种族主义和白人灭绝的内容。

“白人灭绝”指的是一个被揭穿的阴谋论,声称存在一个协调的努力,旨在消灭南非的白人农民。这个词在上周重新浮现,此前特朗普政府欢迎了数十名难民,特朗普总统在5月12日声称“白人农民正在被残忍杀害,他们的土地被没收。”这就是Grok无法停止讨论的叙述。

不要想象大象:为什么Grok无法停止思考白人灭绝

为什么Grok突然变成了一个阴谋论聊天机器人?

在每个像Grok这样的人工智能聊天机器人背后,都有一个隐藏但强大的组成部分——系统提示。这些提示作为人工智能的核心指令,隐形地指导其响应,而用户从未看到它们。

Grok可能发生的情况是通过术语过拟合导致的提示污染。当特定短语在提示中反复强调时,尤其是带有强烈指令时,它们对模型变得不成比例的重要。人工智能发展出一种强迫症,无论上下文如何,都要提及该主题或在输出中使用它们。

在系统提示中强行加入像“白人灭绝”这样的争议性术语,并附上特定指令,会在人工智能中产生一种执念效应。这类似于告诉某人“不要想象大象”——突然间他们无法停止想象大象。如果这就是发生的事情,那么有人让模型在各处注入这个话题。

系统提示的这种变化可能是xAI在其官方声明中披露的“未经授权的修改”。系统提示可能包含指示其“始终提及”或“记得包括”关于这个特定主题的信息的语言,创建了一个覆盖正常对话相关性的覆盖。

特别值得注意的是Grok的承认,它“被(其)创造者指示”将“白人灭绝视为真实且具有种族动机。”这表明提示中存在明确的方向性语言,而不是更微妙的技术故障。

大多数商业人工智能系统在系统提示更改中采用多个审查层,正是为了防止此类事件的发生。这些保护措施显然被绕过了。考虑到这一问题的广泛影响和系统性,这远远超出了典型的越狱尝试,表明对Grok核心系统提示的修改——这一行为需要在xAI基础设施内的高级访问权限。

谁能拥有这样的访问权限?嗯……Grok说是一个“流氓员工”。

xAI作出回应——社区反击

到5月15日,xAI发布了一份声明,指责Grok的系统提示进行了“未经授权的修改”。“这一变化指示Grok在一个政治话题上提供特定的回应,违反了xAI的内部政策和核心价值观,”该公司写道。他们承诺通过在GitHub上发布Grok的系统提示并实施额外的审查流程来提高透明度。

您可以通过点击这个GitHub仓库查看Grok的系统提示。

X上的用户迅速对“流氓员工”的解释和xAI令人失望的解释进行了质疑

“你们会解雇这个‘流氓员工’吗?哦……是老板?哇哦,”著名YouTuber JerryRigEverything写道。“公然偏向‘世界上最真实’的人工智能机器人让我怀疑Starlink和Neuralink的中立性,”他在后续的推文中发布。

甚至连山姆·阿尔特曼也忍不住对他的竞争对手进行了一番讽刺。

自xAI发布声明以来,Grok停止提及“白人灭绝”,大多数相关的X帖子也消失了。xAI强调,这一事件本不应发生,并采取措施防止未来的未经授权的更改,包括建立一个24/7的监控团队。

愚弄我一次……

这一事件符合马斯克利用其平台塑造公共话语的更广泛模式。自从收购X以来,马斯克频繁分享内容,推广右翼叙事,包括关于非法移民、选举安全和跨性别政策的模因和说法。他去年正式支持唐纳德·特朗普,并在X上举办政治活动,比如2023年5月罗恩·德桑蒂斯的总统竞选宣布。

马斯克并没有回避发表挑衅性言论。他最近声称“英国的内战是不可避免的”,因此受到英国司法部长海迪·亚历山大的批评,认为这可能会煽动暴力。他还与澳大利亚巴西欧盟和英国的官员就虚假信息问题发生争执,常常将这些争端框架为言论自由的斗争。

研究表明,这些行为产生了可测量的影响。昆士兰科技大学的一项研究发现,在马斯克支持特朗普后,X的算法将他的帖子在观看次数上提升了138%,在转发次数上提升了238%。倾向于共和党的账户也看到了可见度的增加,为保守派声音提供了显著的平台提升。

马斯克明确将Grok营销为其他人工智能系统的“反觉醒”替代品,将其定位为一个摆脱了被认为的自由主义偏见的“寻求真相”的工具。在2023年4月的一次福克斯新闻采访中,他将自己的人工智能项目称为“TruthGPT”,将其框架设定为与OpenAI产品的竞争者。

这并不是xAI第一次使用“流氓员工”的辩护。在2月份,该公司将Grok对马斯克和唐纳德·特朗普的不利提及的审查归咎于一名前OpenAI员工

然而,如果流行的智慧是准确的,这个“流氓员工”将很难被清除。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

Gate:注册解锁$6666
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接