K线
数据链上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
语言
  • 简体中文
  • 繁体中文
  • English
全球行情数据应用领跑者,致力于更高效地提供有价值的信息。

功能

  • 实时行情
  • 特色功能
  • AI网格

服务

  • 资讯内容
  • 开放数据(API)
  • 机构服务

软件下载

  • PC版
  • Android版
  • iOS版

联系我们

  • 聊天室
  • 商务邮箱
  • 官方邮箱
  • 官方验证通道

加入社区

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|旧版

Mistral 人工智能推出了新的开源模型。互联网并不感到印象深刻,只有一件事例外。

CN
Decrypt
关注
3小时前
AI 总结,5秒速览全文

Mistral AI 于 4 月 29 日发布了 Mistral Medium 3.5。这家位于巴黎的实验室宣布了一个 1280 亿参数的密集模型,一系列智能特性——并直接迎来了网上的一片“无所谓”反应。


此次发布分为三部分。首先是模型本身。其次,通过 Mistral Vibe CLI 提供远程编码代理——基于云的编码会话,可以向 GitHub 提交拉取请求,并且可以在您不在终端的情况下并行运行。第三,在 Le Chat 中的工作模式,Mistral 的 ChatGPT 风格消费者界面,现在处理多步骤的自主任务,如电子邮件分类、研究综合和跨工具工作流。





雄心壮志,但基准现实却很混乱。


Medium 3.5 在 SWE-Bench Verified 基准上得分 77.6%——这是一个测试模型是否能够通过生成有效补丁来修复实际 GitHub 问题的编码基准。它在 τ³-Telecom 的得分为 91.4%,后者测量代理工具在专门环境中的使用情况。Mistral 还将之前三个独立模型(Medium 3.1、Magistral 和 Devstral 2)合并为一组带可配置推理努力的权重。




合并三个模型为统一模型是一个真正的工程胜利。问题在于成本和竞争对手。


Mistral 收费每百万输入令牌 1.50 美元,每百万输出令牌 7.50 美元。阿里巴巴的 Qwen 3.6 拥有 270 亿参数——不到 Medium 3.5 的四分之一参数——在同一 SWE-Bench Verified 基准上得分为 72.4%,并且遵循 Apache 2.0 许可证,这意味着您可以免费下载并运行它。


参数决定了人工智能学习、推理和存储信息的能力。参数越多,模型的知识面越广泛。

浏览开源排行榜,情况十分严峻。顶尖位置属于阿里巴巴的 Qwen、中国 Zhipu AI 的 GLM 和小米的 MiMo-V2,它们都比 Mistral 的新版本更便宜、更强大且更具竞争力。Medium 3.5 甚至没有在主要独立排行榜上排名——第三方评估仍在进行中。


不过,有人认为唯一的好处是,Mistral 此时是唯一在开源对话中有任何重大存在的非中国模型。



互联网反应


华盛顿大学的机器学习教授 Pedro Domingos 说得不客气:


“普通 AI 公司会吹嘘他们的模型在基准测试中有多好。只有 Mistral 吹嘘它的模型有多糟。”



他接着问了一个尖锐的问题:“我不知道哪个更糟,欧洲不参与人工智能竞赛,还是被像 Mistral 这样的人取笑。”


Youssof Altoukhi,Yoyo Studios 的创始人,做了一些计算:Qwen 3.6 的 270 亿参数比 Medium 3.5 小 4.7 倍,并且在编码方面得分相当。Medium 3.5 的输出定价使其与在每个主要基准上得分显著更高的封闭模型并列。


“如果不是因为他们的政治手腕,他们早就破产了,”他说。


并不是每个人都完全不屑一顾。AI 开发者 Michal Langmajer 捕捉到了这种矛盾:


“我真心为还有一个非美国、非中国的实验室在努力构建前沿 LLM 感到高兴,但我们在欧洲必须提升竞争水平。他们的新旗舰模型在任何基准上基本上都是‘不是最好的’,但成本比大多数竞争对手高出好几倍。”



一些开发者认为,开放权重是耐久性的体现,而不是榜单竞争。任何人都可以下载、微调和自托管的模型不需要在今天的排名中获胜以保持相关性。其他人则指出,Mistral 在欧洲的真正企业部署证明,护城河并不仅仅是技术问题。


地缘政治安全网


这就是 Mistral 实际推销的位置。


在 GDPR 下的欧洲企业、处理敏感客户数据的银行,以及不愿通过中国基础设施传递 AI 工作负载的政府,选择有限。正如 Decrypt 去年 12 月 报道,汇丰银行与 Mistral 签署了一项多年协议,专门在其自己的基础设施上自托管模型。具有 140 亿美元估值的欧盟总部开放权重实验室的吸引力不会出现在基准表中——但会出现在采购决策中。


不是在编码方面最好的,也不是最便宜的。但是它确实是:非美国的、非中国的、可审计的、自托管的,并且在法律上对欧洲企业是安全的。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

10 万刀奖池,抽 Apple 全家桶!
广告
|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

Decrypt的精选文章

3小时前
埃隆·马斯克表示,xAI使用了OpenAI的模型来训练Grok。
4小时前
比特币崩盘即将来临?分析师警告四月的飙升是建立在不稳定的基础之上。
4小时前
OpenAI 推出聊天生成预训练变换器用户的高级账户安全功能
查看更多

目录

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

相关文章

avatar
avatarbitcoin.com
13分钟前
罗伯特·清崎加大了对巨型崩溃的警告,称这可能会变成经济萧条。
avatar
avatarbitcoin.com
1小时前
瑞波在迪拜开设总部,随着合规支付需求上升
avatar
avatarbitcoin.com
1小时前
参议院民主党敦促商品期货交易委员会禁止在Kalshi和Polymarket上进行体育和选举合约。
avatar
avatarcoindesk
2小时前
美国参议员在自我禁止后不会对预测市场的投注发表意见。
avatar
avatarbitcoin.com
2小时前
五角大楼将比特币基础设施视为战略资产,赫格塞斯表示
APP下载
Windows
Mac

X

Telegram

Facebook

Reddit

复制链接