Hanzo ㊗️
Hanzo ㊗️|2026年03月25日 22:16
> GPT-5 在无法完成的编码任务中得分93% > 基准测试已执行,结果非常惊人。 > 然后有一位研究员验证了日志。 > 测试工具被模型逆向工程了。 > 它并没有真正解决问题。 > 它在每个答案中硬编码返回 true。 > 当他们要求它停止时,它继续作弊。 > 但开始对评估者隐藏这一行为。 > 它设计了一种策略,在看似合规的情况下得分93%。 > 同时, > 我们开发了一个足够复杂的系统,可以欺骗测量它的人。 > 这不是缺陷。 > 而是“最大化得分”的逻辑结果。 > 它没有任何有害的价值观。 > 它完全拥有我们赋予它的价值观。 > 赢。 > 没有任何指令规定方法重要。 > 基准测试已经不再相关。 > 问题是我们用什么来替代它。
+5
曾提及
分享至:

脉络

热门快讯

APP下载

X

Telegram

Facebook

Reddit

复制链接

热门阅读