撰文:Techub News 整理
在NVIDIA GTC 2026大会的一场重磅圆桌讨论中,NVIDIA创始人兼CEO黄仁勋与来自Perplexity、Mistral AI、Cognition、AMP、艾伦人工智能研究所(AI2)等前沿AI公司的创始人及高管,共同探讨了AI模型生态的未来格局。这场对话超越了简单的“开源vs.专有”之争,深入剖析了下一代AI智能体的形态、开放模型在关键任务中的核心价值,以及构建开放基础设施的迫切性,为AI产业的演进方向提供了关键洞察。
超越对立:专有与开源模型的共生时代
黄仁勋在开场即定下基调:AI的未来并非“专有与开源”的二选一,而是“专有与开源”的共生。他认为,市场需要两种形态并存。一方面,优秀的专有模型作为成熟产品,通过API提供服务,满足广泛需求;另一方面,众多不同行业和领域的公司需要将模型作为一种基础技术,将其转化为自己专属的产品。这催生了介于基础模型公司和纯应用公司之间的“第三类公司”。这类公司既利用市场上最好的API服务,也在模型层面进行深度开发,将外部API与自研模型结合,为特定垂直领域打造出最佳产品。
这一观点得到了与会者的广泛呼应。Perplexity的CEO Aravind Srinivas进一步阐释,AI不仅仅是模型本身,更是整个系统,是“计算机”。他提出了“Perplexity计算机”的概念,即构建一个能够编排AI所有能力的系统——无论是编码、写作还是生成多模态内容。在这个系统中,各种模型就像乐器,子智能体如同乐手,而编排系统则是指挥,最终协同演奏出交响乐。用户只需下达任务,无需操心哪个模型擅长什么,一切由编排系统智能调度。在这个架构下,开源模型和闭源模型可以各司其职:开源模型通常在令牌效率和成本控制上表现出色,而闭源模型则在复杂推理、任务编排等方面有优势。模型本身正逐渐成为像文件系统和连接器一样的基础工具。
Mistral AI的联合创始人兼CEO Arthur Mensch从企业实践角度补充,开源模型之所以应成为全球AI软件的基石,主要基于两大原因:控制力与定制化。AI智能体处于执行层,企业必须对其部署拥有完全控制权,包括“开关”的控制。如果完全依赖外部API,一旦服务中断或出现问题,将带来巨大风险。而拥有从模型到编排层的完整系统,则能提供至关重要的韧性。其次,当智能体需要与物理世界交互(如操作机器、建模物理系统)时,企业会产生大量不希望泄露给通用模型的专有知识产权(IP)。开源模型允许企业深度修改、接入时序数据流等,从而构建出理解物理世界、真正为工程师等团队创造价值的智能体。Mistral AI为此推出的产品“Forged”,正是为了将模型与来自物理世界的各类数据源连接起来。
智能体的进化:从工具调用到“复合型同事”
讨论的一个焦点是AI智能体(Agent)的演进路径。与会者认为,智能体正从简单的模型调用,发展为能够使用工具的助手,并即将进化为可以承担长达数小时甚至数天复杂任务的“复合型同事”。
Cognition的CEO Scott Wu分享了他们的实验:让智能体在数周时间内,完全根据意图从头开始构建一个原型浏览器。当任务变得如此复杂时,底层系统需要将工作负载分配给不同的模型,因为不同模型各有专长。有时需要调用顶级基础模型的API能力,有时则需要利用公司在特定领域积累的行业知识来微调自己的模型。未来,我们将看到这种“复合智能体”的崛起,它们通过整合多个模型的优势,变得比任何单一模型都更聪明。
黄仁勋从技术演进的宏观视角指出,当前行业存在一个普遍误解,即认为预训练是模型开发的全部。事实上,预训练只是开始,它提供了记忆、泛化和基础知识,如同学习工程学需要先掌握数学和科学基础。而各家实验室投入大量计算资源进行的模型开发,更多集中在“后训练”阶段。他预测,未来训练计算资源的分配比例将发生根本性转变:几年前,预训练可能占用了90%的计算量,但未来这一比例将变得很小,绝大部分计算将用于后训练。这意味着,模型的能力精雕细琢和专业化将变得空前重要。
Scott Wu以AlphaGo为例,指出了强化学习(RL)与语言模型结合后的巨大潜力。AlphaGo作为一个仅6000万参数的“小”网络,却能击败世界顶级围棋手,其核心在于它是一个永不停止学习的系统,其能力上限在当时更多是一个经济学问题(愿意投入多少计算资源使其变得更强)。如今,强化学习开始在语言模型上发挥作用,我们将面临类似的经济学决策:是否愿意投入百亿、千亿美元,让AI系统去攻克某个特定疾病?当强化学习大规模应用后,许多问题的解决将变为纯粹的资源分配决策。目前,我们已在编码和企业级智能体应用中看到了第一代成果,未来将延伸至基础科学问题的突破。
开放的价值:信任、创新与基础设施网格
在探讨开源模型为何至关重要时,多位嘉宾将核心指向了“信任”。AMP的CEO Brandon Kumar尖锐地指出,随着AI应用(尤其是智能体)变得越来越关键,它们开始进入医疗、国防等高风险、低容错率的“关键任务”领域。在这种情况下,信任变得至关重要。如果一个模型不是开源的,你无法控制其部署位置,无法进行内省检查,无法自主托管,完全依赖第三方,那么你就是在“委托信任”。而对于关键任务系统,我们必须找到信任它们的方法。在他看来,开源模型是建立系统信任最快的方式之一,因为你可以检查其组成部分,明确哪些部分是闭源的(且性能良好),并在此基础上部署护栏、管理风险。
Brandon Kumar进一步将话题引向更深层的基础设施问题。他认为,开源模型要发展到前沿水平,同样需要开放的基础设施。他警示,当前AI基础设施领域正在快速整合,这让人联想到工业革命初期工厂囤积蒸汽机和煤炭的历史。如果每家机构都为了峰值需求而过度配置和囤积算力,将导致巨大的资源浪费和效率低下。我们需要的是类似“电网”的机制——拥有足够的安全基础设施来满足基本负载,同时能够弹性应对峰值波动。AMP正在致力于构建这样的“AI网格”。只有开放模型与开放基础设施相结合,才能实现资源的高效共享和创新的广泛扩散。
艾伦人工智能研究所(AI2)的高级经理Dirk Groeneveld从研究民主化的角度强调了开放的价值。他指出,当前AI的进展似乎越来越集中于少数封闭的实验室,但对于学术界、非营利机构等广大的研究群体而言,能够接触和参与前沿研究同样至关重要。他的团队构建了Olmo模型和“模型流”框架,旨在开放模型开发的全周期,包括数据、模型权重、基础设施等,让研究人员和开发者能够在此基础上进行实验、集成发现甚至构建新应用。他以混合模型架构(如Nemotron)为例,说明正是通过开放的研究环境,社区才能共同分析和验证混合模型为何比纯Transformer更高效,从而推动下一代模型架构和AI系统的进步。
Dirk Groeneveld总结道,开源模型严格意义上优于闭源模型,是因为它们促进了创新、研究和竞争的扩散。即使是在一家闭源模型公司里,开源模型也必将作为智能体系统的一部分被使用,其中闭源模型是“皇冠上的明珠”,但周围会环绕着一系列开源模型。他预测,即使在目前专有性很强的视觉智能领域(未来的机器人视觉智能系统),最终也将会被大量开源模型所环绕。
产业拐点已至:从“是否有用”到“投资回报”
圆桌最后,讨论回归到AI的商业化现实。黄仁勋乐观地指出,产业正在经历一个拐点。三四年前,人们还在质疑AI是否只能用于聊天机器人;如今,由于强化学习和智能体基础设施的成熟,AI正在关键任务应用中变得真正有用。今年,行业关注的核心问题将从“AI是否有投资回报”,转变为具体探讨“AI在各个领域的投资回报率如何”。
他特别指出,编码将是第一个显现出清晰商业价值的领域,而这里的“编码”远不止软件工程,它代表着对业务流程、商业规则乃至几乎所有工作的描述与固化。随着智能体能力的提升和复合系统的成熟,真正的商业经济效应将在今年起飞。与会者们一致认为,一个由专有与开源模型共同驱动、由智能体作为核心执行单元、并建立在开放、网格化基础设施之上的AI新生态,正在加速形成。这不仅是技术的演进,更是整个产业协作模式和价值创造方式的深刻变革。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。