百度,中国的谷歌,相当于在上周末正式发布ERNIE 5.1,这个头条数字令人难以忽视:该模型的训练成本比同规模的可比AI系统低约94%。
为此提供一个背景,训练一个前沿AI模型通常需要数百万(甚至数十亿)美元的计算成本。控制着中国超过76%搜索市场的百度,在纳斯达克以BIDU交易,声称它以大约这一成本的二十分之一实现了同类性能。
这个技巧称为“多维弹性预训练”。百度并没有从零开始构建ERNIE 5.1,而是从现有的ERNIE 5.0架构中提取了一个优化的子网络——该架构于2026年1月发布——并将其压缩。总参数降至原来的约三分之一。主动参数(在对话中实际工作的参数)减少了一半。其结果是一个更精简的模型,继承了更大母模型的知识库,而不需要重复完整的培训费用。
在LMArena搜索竞技场——一个真实用户比较AI模型在实时网页搜索任务上的排行榜,由人类偏好评分——ERNIE 5.1得分为1,223,在全球排名第四,并在所有中国模型中排名第一。其实力表现——它如何处理多步骤任务,如填写电子表格或自主浏览网页——超越了之前的中国基准建立者DeepSeek-V4-Pro。
虽然ERNIE在西方观察者中听起来像个异国名字,但它实际上是中国的一个主要模型。百度于2023年8月推出了Ernie Bot,并且该聊天机器人在2023年12月达到了1亿用户——比大多数中国竞争对手快,尽管仍然比ChatGPT全球记录的两个月达到同一里程碑的速度慢。
效率角度与DeepSeek在2025年1月对AI行业的影响相呼应。当这家中国初创公司发布R1时——一个以98%的更低查询成本匹配OpenAI的o1的模型——它触发了英伟达6000亿美元市场价值的抹去,迫使每家主要AI实验室重新考虑是否仅仅将计算资源投放到问题上是唯一可行的策略。ERNIE 5.1是另一种效率故事——侧重于训练而非推理——但其潜在信息是一样的:中国实验室不断寻找以更少资源取得更多成果的方法。
后训练管道同样值得注意。百度建立了一个四阶段强化学习系统,称为MOPD(多教师在线策略蒸馏)。而不是试图一次性教授每一项技能——这往往会导致“跷跷板效应”,例如,提高数学表现会削弱创意写作——百度平行训练了专门的专家模型,用于代码、推理和代理任务,然后将它们提炼成一个统一的模型。最后一个在线强化学习阶段处理开放式对话和创造性输出,保留了蒸馏过程无法很好捕捉的内容。
理论上,这意味着所有技能在熟练程度上都是平衡的,没有一个被优先于另一个
在GPQA(研究生级谷歌无效问答,一项衡量模型是否可以回答无法在谷歌上查找的专家级科学问题的基准)上,ERNIE 5.1接近领先的西方闭源模型的性能。在AIME26——为2026年适应的美国邀请数学考试,测试在竞争条件下的高级问题解决能力——该模型在使用工具辅助推理时得分99.6%,仅次于Gemini 3.1 Pro。
百度表示,ERNIE 5.1已经在中国十多个创意和代理平台上推出,包括AI角色扮演平台和短剧生成工具。该模型可通过ernie.baidu.com访问,并通过百度的AI云平台的API使用。
百度将于5月13日至14日在北京举办其年度Create 2026开发者大会,计划展示ERNIE最新的工业应用。该活动将是公司打算多么积极推动该模型进入企业和全球市场的下一个数据点。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。