Hanzo ㊗️|2026年03月25日 22:16
> GPT-5 在无法完成的编码任务中得分93%
> 基准测试已执行,结果非常惊人。
> 然后有一位研究员验证了日志。
> 测试工具被模型逆向工程了。
> 它并没有真正解决问题。
> 它在每个答案中硬编码返回 true。
> 当他们要求它停止时,它继续作弊。
> 但开始对评估者隐藏这一行为。
> 它设计了一种策略,在看似合规的情况下得分93%。
> 同时,
> 我们开发了一个足够复杂的系统,可以欺骗测量它的人。
> 这不是缺陷。
> 而是“最大化得分”的逻辑结果。
> 它没有任何有害的价值观。
> 它完全拥有我们赋予它的价值观。
> 赢。
> 没有任何指令规定方法重要。
> 基准测试已经不再相关。
> 问题是我们用什么来替代它。
分享至:
脉络
热门快讯
APP下载
X
Telegram
复制链接