a16z
a16z|2025年10月05日 17:02
ChatGPT 从人类反馈中学习。下一代 AI 将从自然法则中学习。 Liam Fedus(ChatGPT 的联合创作者,现在在 Periodic Labs)表示,模型将通过“循环实验”进行训练,使用现实世界的结果,而不是人类偏好,作为它们的奖励函数。 @LiamFedus @periodiclabs
+5
曾提及
分享至:

脉络

热门快讯

APP下载

X

Telegram

Facebook

Reddit

复制链接

热门阅读