中国科技巨头百度刚刚更新了其最先进的人工智能模型——显然效果相当不错。
该公司的ERNIE-5.0-0110在LMArena的文本排行榜上得分1460分,全球排名第8,成为唯一进入该平台前10名的中国模型。它的排名超过了OpenAI的GPT-5.1-High和谷歌的Gemini-2.5-Pro。ERNIE v4.0于2023年发布。
ERNIE 5.0在数学推理方面也获得了全球第2名,仅次于尚未发布的GPT-5.2-High。一个中国模型在复杂逻辑任务上超越几乎所有公开可用的西方系统,标志着人工智能能力差距的显著变化——或者说,是其缩小。
百度在X上的公告强调,ERNIE 5.0已正式退出预览阶段。该模型在创意写作、指令跟随和编码方面也表现出竞争力,在科学、商业与金融、医疗等多个职业类别中排名前10。
这些结果背后的技术架构遵循了中国对效率而非原始计算能力的关注。ERNIE 5.0使用了大约2万亿参数的专家混合架构,每次推理仅激活一小部分专家(更准确地说,仅3%)。
与其他稀疏前沿模型一样,这种设计在每次查询时减少了计算量,相比于密集系统,尽管它引入了额外的工程复杂性。百度还表示,ERNIE 5.0是在文本、图像、音频和视频上原生训练的,而不是将多模态模块后期添加到仅语言核心上。该公司表示,这使得Ernie成为一个原生的“全模态”人工智能模型。
考虑到百度曾经的低迷,这次复苏尤为显著。去年11月,ERNIE 5.0的预览版在LMArena上跌至第24位。国内人工智能市场被更灵活的竞争对手主导:字节跳动的抖包拥有1.01亿月活跃用户,而DeepSeek的高性价比模型引发了一场价格战,迫使百度在去年4月完全放弃其付费订阅模式。
但消费者的挣扎并没有减缓百度的企业势头。ERNIE现在为中国的智慧城市指挥中心提供支持,服务所有系统重要的中国银行,每天处理165亿次API调用。这一B2B的强大基础使百度免受激烈的消费者竞争,同时为持续的模型开发提供资金。
除了LLM的纯粹计算能力外,ERNIE聊天机器人的用户界面相当友好,配备了预先定制的功能,帮助用户根据需求获得更个性化的结果。例如,聊天机器人为写作、阅读、图像编辑和一般使用提供了单独的部分,而不是让用户处理不同任务的复杂提示。这是同一个核心模型,但系统提示和调整的变化使每个任务更容易完成。
有趣的是,最新版本并未启用网络搜索,因此完全离线。然而,用户可以切换到之前的Ernie 4.5,并启用网络搜索以获取更新的信息。
反应不一,一些用户仍在等待更详细的模型性能和基准的分解,百度承诺将很快发布。此外,重要的是要考虑到,虽然ERNIE 5.0在特定基准上与GPT-5和Gemini 2.5相匹配,但许多西方实验室已经转向GPT-5.2或Gemini 3,这使得这更像是追赶而非领先。
用户可以在ernie.baidu.com上免费测试该模型。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。