| AiCoin 实时快讯

ETH

💲2316.06

0.31%

Zhixiong Pan|2025年12月30日 15:46

== 2025 的 AI 行业太吵了，我只摘出了这 10 句话作为年度总结 == 如果你和我一样读不过来这些密集的信息，我试着从这些总结性质的报告和论文中，分别只摘录出一句话。这些碎片拼凑出的主线是：硅谷正致力于将 AI 进化为「推理智能体」，而中国开源力量的崛起，正在打破这场技术进化的垄断格局。 1️⃣ Karpathy：2025 年 LLM 年度回顾 > 我们不是在「进化/培育动物」，而是在「召唤幽灵」。 2️⃣ Google DeepMind：分布式 AGI 的安全性 > AGI 并非一个实体，而是一种「事态」（state of affairs）：一个成熟、去中心化的智能体经济体，其中人类的主要角色是编排与验证。 3️⃣ OpenAI：前沿科学：评估 AI 执行专家级科学任务的能力 > 总体上，我们发现前沿 AI 系统在解决专家级推理问题方面进展迅速，尤其是在自包含的奥赛题上；但在研究风格任务上仍远未饱和。 4️⃣ OpenAI：2025 年企业级人工智能现状 > 从「向模型索取输出」向「将复杂多步骤工作流委托给模型」的转变。 5️⃣ OpenRouter & a16z ：AI 现状：基于 OpenRouter 的一百万亿 Token 实证研究 > 领域的重心从单次前向的模式生成转向多步审慎推理式推断。 6️⃣ 《AI 如何改变 Anthropic 的工作方式》（Anthropic） > Claude 是持续的协作者，但使用通常需要主动监督与验证，尤其是在高风险任务中；而不是把无需任何核验的任务直接交出去。 7️⃣ DeepSeek‑V3.2：推动开源大语言模型前沿 > DeepSeek‑V3.2 的表现可与 GPT‑5 相当。 8️⃣ UC Berkeley / Stanford / IBM Research：生产环境中的智能体评估 > 可靠性仍然是当前最主要的开发挑战，其根源在于难以保证并评估智能体行为的正确性。 9️⃣ Anthropic ：AI 智能体发现 460 万美元区块链智能合约漏洞 > 有利可图的、真实世界的自主漏洞利用在技术上是可行的。 🔟 DeepSeek‑OCR：上下文光学压缩 > 我们探索一种潜在解决方案：将视觉模态作为文本信息的高效压缩媒介。 👉论文/研究/报告：https://randomarea.com(Zhixiong Pan)

APP下载

Windows

Mac

分享至：

Facebook

复制链接

分享至：

热门快讯

热门阅读