有人在《Minecraft》中构建了一个可工作的AI聊天机器人——以下是方法。

CN
Decrypt
關注
4 小時前

在周末,一位Minecraft大师完成了一个惊人的壮举:在这个极受欢迎的沙盒游戏中嵌入了一个可工作的语言模型推理引擎。关键是什么呢?所有的“布线”都是通过Minecraft的红石系统完成的——没有命令方块,没有模组(除了渲染辅助),仅仅是用游戏内材料构建的电路逻辑。

结果是古怪、痛苦缓慢,但又令人着迷:一个基于数字红石和模拟逻辑的GPT风格聊天机器人,存在于一个方块世界中。

要理解这个壮举,你需要知道红石是什么。在Minecraft中,红石是游戏中电线和电子元件的类比:电源、延迟器、比较器、逻辑门、信号延迟——所有这些都是用方块构建的。红石电路在游戏世界中模拟数字行为(开/关,逻辑运算)。

早在很久以前,玩家们就利用红石在Minecraft中构建了计算器、存储单元,甚至是CPU——而现在他们将其推向了人工智能领域。构建GPT黑客的Sammyuri甚至在Minecraft中使用红石构建了一个递归版本的Minecraft。

这个项目中,创作者首先在游戏外(使用Python)训练了一个小型语言模型,使用的数据集称为TinyChat。该模型大约有5,087,280个参数,嵌入维度为240,词汇量约为1,920个标记,六层,上下文窗口为64个标记。大多数权重被量化为8位,尽管嵌入和LayerNorm权重使用更高的精度。红石构建本身大约跨越1,020 × 260 × 1,656个方块(≈总共4.39亿个方块)。为了拍摄这个规模,创作者使用了Distant Horizons模组,该模组允许在一个巨大的世界中可视化远处的结构。

当你输入一个提示(通过游戏内界面)时,红石电路逐步执行推理步骤,包括嵌入查找、前馈传递、矩阵乘法和softmax近似。根据视频演示,这个复杂的红石构建花费了几个月的时间来组装。

但这个系统的速度极其缓慢。即使在人工提升的滴答率下(约比正常快40,000倍,通过MCHPRS),响应时间也在几个小时的范围内。按照标准的Minecraft速度,有人估计生成一个答案可能需要超过九年。

尽管如此,这个项目的重点并不是实用性——而是展示。这个构建的核心是一个有趣的证明,表明神经推理可以被重新构建到几乎任何逻辑基底中。它提醒我们,我们的软件和硬件堆栈隐藏了多少抽象:架构、媒介和速度是不同的维度。换句话说,这是一件技术艺术作品,一个引发对话的起点:重要的是计算,而不一定是它运行的地方。

这重要吗?是的,确实重要

显然,这并不实用,但它很酷,因为它展示了一些深刻的东西:逻辑和神经风格的计算可以映射到奇怪的基底——在这里,是虚拟的红石电路。这是对计算普遍性的有趣证明,是一件艺术和教育的展品,也是对我们关于“智能”如何以及在哪里运行的假设的挑战。

它迫使我们思考:在一个模型中,什么是真正重要的——架构、媒介、速度——还有哪些其他奇怪的基底可以尝试(光学、DNA、机械系统)?

在网络上,这个构建引发了热烈的讨论。Tom’s Hardware 发表了一篇文章,详细分析了方块数量、红石逻辑和性能权衡。在Hacker News上,评论者们对工程技术感到惊叹,但也指出了局限性:“在正常的红石滴答率下……响应时间将超过9年。”与此同时,在Minecraft的子版块上,粉丝和怀疑者们辩论着这一成就究竟是视觉盛宴还是技术深度。

一些观察者认为这个项目更像是一个模因,而不是研究。确实,真正的训练是在外部进行的;Minecraft仅仅承载了推理逻辑。它更像是一个展示品,而不是一个实用模型。但这正是它的魅力所在——也是它的目的。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接