Zhixiong Pan
Zhixiong Pan|2026年01月08日 17:57
DeepSeek R1 论文 v2 中文翻译版已更新,摘录几个他们对于之前广泛质疑的首次回应: 1️⃣ 为什么 DeepSeek 回答中出现 OpenAI/ChatGPT? > 对于 DeepSeek‑V3‑Base 的训练数据,我们只使用自然网页与电子书,不刻意加入任何合成数据。但我们观察到部分网页中存在大量由 OpenAI 模型生成的答案,这可能使基座模型在预训练中“间接”获得其他强模型的知识。 2️⃣ DeepSeek R1 之后会关注什么? > 目前 DeepSeek‑R1 的结构化输出能力仍不如一些现有模型;同时它尚不能利用搜索引擎、计算器等外部工具提升输出质量。但由于为结构化输出与工具使用构建 RL 环境并不困难,我们预计下一版本会解决该问题。 3️⃣ 为什么 DeepSeek 推理中会中英混用? > DeepSeek‑R1 目前主要针对中文与英文优化;在处理其他语言的查询时可能出现语言混用,例如即便输入是非中非英语言,模型仍可能用英语进行推理并输出。我们计划在后续更新中改进。该问题可能与基座模型 DeepSeek‑V3‑Base 训练数据以中英为主有关。 4️⃣ DeepSeek R1 和 R1-Zero 的训练成本如何? > DeepSeek‑R1‑Zero 约 $202K;DeepSeek‑R1 约 $82K 还有大量细节:https://randomarea.com/deepseek-r1-v2/(Zhixiong Pan)
+5
曾提及
分享至:

脉络

热门快讯

APP下载

X

Telegram

Facebook

Reddit

复制链接

热门阅读