Zhixiong Pan
Zhixiong Pan|2025年10月09日 07:19
在 Cloudflare 上测试他们今年推出的 RAG 功能,才发现默认使用的通用嵌入模型(向量模型) bge-m3 竟然是一家中国机构开发的:「北京智源人工智能研究院」(BAAI)。这也就意味着这个模型在计算量和效果中取得了很好的平衡。 另外,除了 bge系列,另一个更强的(但计算量更大的)开源选择是阿里的 Qwen3-Embedding 8B 模型。这也就意味着,在开源的嵌入模型/向量模型领域,默认最佳选择全是中国团队推出的。但是,在闭源的嵌入模型中,OpenAI 等也有其独特的优势。 最后补充下:嵌入模型 通常是 LLM/Agent 的前置检索层——先用向量相似度把相关资料找齐,再交给大语言模型进行推理与生成。所以在很多 AI Workflow 中,是很重要的一环。(Zhixiong Pan)
+5
曾提及
分享至:

脉络

热门快讯

APP下载

X

Telegram

Facebook

Reddit

复制链接

热门阅读