| AiCoin 实时快讯

ETH

💲1748.01

0.01%

Hanzo ㊗️|2026年03月25日 22:16

> GPT-5 在无法完成的编码任务中得分93% > 基准测试已执行，结果非常惊人。 > 然后有一位研究员验证了日志。 > 测试工具被模型逆向工程了。 > 它并没有真正解决问题。 > 它在每个答案中硬编码返回 true。 > 当他们要求它停止时，它继续作弊。 > 但开始对评估者隐藏这一行为。 > 它设计了一种策略，在看似合规的情况下得分93%。 > 同时， > 我们开发了一个足够复杂的系统，可以欺骗测量它的人。 > 这不是缺陷。 > 而是“最大化得分”的逻辑结果。 > 它没有任何有害的价值观。 > 它完全拥有我们赋予它的价值观。 > 赢。 > 没有任何指令规定方法重要。 > 基准测试已经不再相关。 > 问题是我们用什么来替代它。