Perplexity 希望您的笔记本电脑承担部分人工智能工作——这样它就不必这样做了。

CN
Decrypt
關注
1 小時前

Perplexity首席执行官阿拉文·斯里尼瓦斯于6月2日在台北的Computex 2026会议上与英特尔首席执行官李博坦共同登台,宣布公司推出的首个混合本地服务器推理编排器。该系统将在七月上线Perplexity Computer,自动决定AI任务的哪些部分在您的机器上运行,哪些部分通过云端更强大的模型进行处理—而无需您进行选择。


“今天我们宣布个人计算机的下一步:首个混合本地服务器推理编排器,”Perplexity宣布。“它决定哪些工作应该在您的设备上运行,哪些工作应该转到云端代理,并自动将任务的每个部分路由到正确的地方。”


“AI系统的正确目标是为每个用户提供每瓦特最优的令牌价值,”Perplexity在官方公告中写道。三种相互竞争的压力让这个目标变得困难:准确性要求最有能力的模型,隐私要求一些数据永远不离开您的机器,成本则要求你不要在一个较小的任务上花费前沿模型的计算资源。


Perplexity称之为“混合代理推理”的解决方案同时解决了这三点。一个紧凑的模型在您的设备上本地运行,并充当交通警察—确定哪些信息足够敏感需要保持本地,哪些任务需要云端前沿模型的全部计算能力。





“混合代理推理适用于包含敏感数据但需要强大AI的工作。例如财务记录、健康信息和个人文件,”该公司解释道。“紧凑模型在您的设备上本地运行,以确定何时敏感数据也应保持本地。同时,需要前沿模型全部能力的工作则在服务器上运行。”


你应该在乎这个吗?


推理—运行经过训练的AI模型以生成响应的过程—是每次您向聊天机器人发送提示所发生的计算工作。目前,几乎所有推理工作都发生在AI公司拥有的远程服务器上。这意味着您的财务文件、健康查询和私人笔记在您收到答复之前必须传送到其他计算机。


这也是为什么您在聊天机器人上看到“自动”模式或“低思考”模式。AI公司总是试图迫使用户以对他们来说最便宜的模式进行互动。


斯里尼瓦斯对此非常直言。在Computex的一次彭博电视采访中,他大声说出了隐秘的部分:“您不想将所有计算集中在服务器上并让一切都通过最大的模型运行。有些人每月花费五亿美金。您真正想要的是每用户每瓦特的高效价值。”将推理工作卸载到用户硬件上可以减少这些费用—对Perplexity而言。


本地推理对那些公司来说是最佳选择,因为它大幅降低了成本,但对AI用户来说也有一个重大优点:它将数据保留在您的机器上。权衡始终是计算能力:本地运行的小模型不如数据中心中的大型模型强大。


Perplexity的编排器试图兼顾这两者。简单任务—如总结您已撰写的文档、格式化文本、轻量级分类—在本地运行。复杂推理则被路由到云端,理想情况下不附带您任务的敏感部分。该公司表示,这些操作在任务中自动进行,用户看不见。不知道其路由在实际应用中是否如Computex演示所听起来那样可靠,七月的发布将会给出答案。


值得澄清的一点是:这并不是Perplexity免费提供您可以控制的开源本地模型。当地组件是Perplexity作为其应用程序一部分部署的紧凑模型。云组件仍然通过Perplexity的服务器进行路由。想要完全离线、自托管设置的用户—例如MiniCPM5-1B提供的那种—在这里找不到。


这些数字提供了背景框架。Perplexity的收入$1亿增长到5亿美元,而员工人数仅增加了34%,斯里尼瓦斯在四月宣布。一个在跨多个模型中路由查询而不训练这些模型的公司,有强烈的动机将计算成本保持在尽可能低的水平。将部分推理负担转移到用户设备—目前已经在流通的数十亿台PC上—是一种高效的方法。隐私的说法是真实的,但它与财务说法的利益恰好是一致的。


还有谁在做这个


目前每个主要的AI参与者都在推动设备上或混合推理。Apple Intelligence在M系列芯片上本地运行其最敏感的处理。微软的Foundry Local在2026年四月达到了全面可用,支持在Windows、macOS和Linux上无云依赖的完整AI推理。


Nvidia在Perplexity公告的同一Computex上宣布了RTX Spark,目标是在笔记本和台式机上进行本地LLM推理。谷歌的做法如Decrypt报道的那样,更具争议性—Chrome悄然在未征得用户同意的情况下安装了一个4GB的Gemini Nano模型,而大多数用户实际上看到的“AI模式”按钮甚至不使用它。


Perplexity的差异化在于编排层。该系统并不要求用户事先选择本地或云,而是实时根据任务进行决定。斯里尼瓦斯表示,该方法是“平台无关”的—Computex演示在英特尔Core Ultra系列3上运行,但也支持Nvidia处理器。该功能目前仅限于Perplexity的Windows PC应用程序,尚未确认更广泛的推出时间表。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接