Zhixiong Pan|2025年12月30日 15:46
== 2025 的 AI 行业太吵了,我只摘出了这 10 句话作为年度总结 ==
如果你和我一样读不过来这些密集的信息,我试着从这些总结性质的报告和论文中,分别只摘录出一句话。
这些碎片拼凑出的主线是:硅谷正致力于将 AI 进化为「推理智能体」,而中国开源力量的崛起,正在打破这场技术进化的垄断格局。
1️⃣ Karpathy:2025 年 LLM 年度回顾
> 我们不是在「进化/培育动物」,而是在「召唤幽灵」。
2️⃣ Google DeepMind:分布式 AGI 的安全性
> AGI 并非一个实体,而是一种「事态」(state of affairs):一个成熟、去中心化的智能体经济体,其中人类的主要角色是编排与验证。
3️⃣ OpenAI:前沿科学:评估 AI 执行专家级科学任务的能力
> 总体上,我们发现前沿 AI 系统在解决专家级推理问题方面进展迅速,尤其是在自包含的奥赛题上;但在研究风格任务上仍远未饱和。
4️⃣ OpenAI:2025 年企业级人工智能现状
> 从「向模型索取输出」向「将复杂多步骤工作流委托给模型」的转变。
5️⃣ OpenRouter & a16z :AI 现状:基于 OpenRouter 的一百万亿 Token 实证研究
> 领域的重心从单次前向的模式生成转向多步审慎推理式推断。
6️⃣ 《AI 如何改变 Anthropic 的工作方式》(Anthropic)
> Claude 是持续的协作者,但使用通常需要主动监督与验证,尤其是在高风险任务中;而不是把无需任何核验的任务直接交出去。
7️⃣ DeepSeek‑V3.2:推动开源大语言模型前沿
> DeepSeek‑V3.2 的表现可与 GPT‑5 相当。
8️⃣ UC Berkeley / Stanford / IBM Research:生产环境中的智能体评估
> 可靠性仍然是当前最主要的开发挑战,其根源在于难以保证并评估智能体行为的正确性。
9️⃣ Anthropic :AI 智能体发现 460 万美元区块链智能合约漏洞
> 有利可图的、真实世界的自主漏洞利用在技术上是可行的。
🔟 DeepSeek‑OCR:上下文光学压缩
> 我们探索一种潜在解决方案:将视觉模态作为文本信息的高效压缩媒介。
👉论文/研究/报告:https://randomarea.com(Zhixiong Pan)
分享至:
热门快讯
APP下载
X
Telegram
复制链接