GPT-5 备忘单:关于 OpenAI 最新 AI 飞跃的 13 件事

CN
Decrypt
關注
4 小時前

OpenAI 发布了 GPT-5,在周四的直播中揭晓,标志着该公司所称的人工智能能力的质变,经过几个月的期待和多次延迟。该模型今天将向所有 ChatGPT 用户推出。

此次发布代表了 OpenAI 试图将其各种 AI 技术统一为一个系统。该公司将推理描述为其人工通用智能战略的核心,突破消除了速度与分析深度之间的先前权衡。用户不再需要在快速响应和深度推理能力之间做出选择——GPT-5 同时提供这两者。

以下是您需要了解的要点。

1. 我什么时候能使用?

GPT-5 今天在 ChatGPT 和其 API 上推出。微软也立即 将 GPT-5 集成到其产品中,通过 Copilot 和 GitHub Copilot 提供。

如果您已更新 带有 Copilot 的 Edge 浏览器,您现在应该可以使用它。

2. 每个人都能得到相同的版本吗?

是的,算是:免费用户将从标准的 GPT-5 开始,使用配额耗尽后将过渡到更轻的“GPT-5 mini”版本。专业订阅用户(每月 200 美元)可以无限制访问完整模型,而 Plus 订阅用户(每月 20 美元)可以访问标准的 GPT-5。

专业订阅用户可以以最高智能水平运行 GPT-5,并享有额外功能,如提前访问其高级代理、无限使用、更深层次研究的更多能力、优先访问以及更高限制的视频和屏幕共享的高级语音模式。

3. 多模态是什么意思?是否会取消单独的图像生成器?

多模态意味着 GPT-5 可以处理和生成不同类型的内容——文本、图像、语音,甚至现在的视频——所有这些都在同一对话中进行。该模型在复杂任务中展示了增强的外语理解能力,能够生成包含法语单词和正确发音的完整网站。

GPT-5 可以独立完成所有任务,而不需要在 Vision、Sora、GPT 和“o”模型之间切换进行推理。

4. 上下文窗口有多大,为什么这很重要?

GPT-5 的输入上下文窗口为 256,000 个标记,API 接受最多 272,000 个输入标记,并发出最多 128,000 个推理和输出标记,总上下文长度为 400,000 个标记。

这意味着它可以一次处理大约 200,000 个单词——相当于一本长小说。更大的上下文窗口使 GPT-5 能够在更长的交互中保持连贯的对话,并分析整个代码库或冗长的文档,而不会丢失重要细节。

也就是说,按照今天的标准,这个窗口并不算大。仅供参考,Gemini 2.5 能够处理 100 万个标记

5. 它有什么新功能?

实际上没有,但它的一些技能升级到如此程度,以至于它们会感觉像新功能。

6. 那么它有什么特别之处?

GPT-5 在几乎所有方面都更强大。例如,在演示中,它展示了出色的编码能力,在被要求从头创建一个伯努利效应模拟时,在两分钟内编写了超过 400 行代码。演示中展示的其他酷炫功能:

  • 语音交互听起来不那么机械,并引入了与竞争对手如 Gemini Live 相匹配的实时视频功能。

  • 该模型现在可以分析上传的图像并将其纳入响应中。

  • 它在代理任务方面表现更好,并且据说能够处理现实世界的应用并解释其推理。

  • 下周用户将能够集成 Gmail 和 Google 日历,这将使其成为更好的助手。

7. 定价有变化吗?

ChatGPT 的订阅定价保持不变,Plus 每月 20 美元,Pro 每月 200 美元。

对于 API 用户,标准模型的 GPT-5 每百万输入标记收费 1.25 美元,每百万输出标记收费 10.00 美元。GPT-5 mini 每百万输入标记收费 0.25 美元,每百万输出标记收费 2.00 美元,而 GPT-5 nano 的输入费用为 0.05 美元,输出费用为 0.40 美元。

这使得该模型在与其他公司的产品竞争时具有优势,甚至比 OpenAI 的其他模型如 GPT-4.1 或 OpenAI o1 pro(每百万标记高达 600 美元)更便宜。

8. 我们已经达到了 AGI 吗?

没有。然而,该公司将推理定位为“我们 AGI 计划的核心”。

该模型代表了显著的进步,但仍然专注于特定任务,而不是在所有领域与人类智能相匹配。例如,GPT-5 在语言任务方面表现出色,但缺乏独立执行广泛活动所需的通用智能。它尚未具备自我学习或自我适应的能力。

9. GPT-5 能生成视频吗?

还不能。虽然视频生成未包含在初始发布中,但 OpenAI 有 Sora 作为单独的视频创作产品。

首席执行官 Sam Altman 之前表示,未来版本将“最终”支持视频。

不过,当前版本确实理解实时视频,因此它可以观看您尝试修理自行车并提供实时指导。

10. 与之前的模型相比,它的可靠性如何?

OpenAI 报告称,GPT-5 “明显不那么具误导性”,解决了大型语言模型部署中最持久的挑战之一。

在事实准确性基准测试中,GPT-5 的事实错误大约比 o3 少 80%,根据 OpenAI 首席科学家 Jakub Pachocki 的说法,使其在企业应用中更值得信赖。

11. 关于记忆和个性化呢?

GPT-5 据说将在会话之间提供更好的持久记忆,记住多个对话中的事实、偏好和指令,即使您关闭应用程序并在几天后打开新标签页。GPT-4 的记忆有限,尤其是在会话暂停几天后。

该公司表示,您现在可以设定长期目标(例如,帮助我以健康的方式减掉 10 磅,或帮助我准备物理考试),GPT-5 将相应调整其响应,以主动与您的目标保持一致。

12. 我的个人数据有多私密?

Altman 之前承认,如果法律要求,OpenAI 可能需要向政府交出用户的个人数据。

13. 我还需要在不同模型之间切换吗?

不再需要——除非您想通过 Sora 生成视频。随着 GPT-5 的推出,OpenAI 表示有信心弃用所有先前的模型。

该公司设计 GPT-5 以处理所有以前需要专门模型的用例,尽管用户仍然可以根据速度和成本要求在 GPT-5、GPT-5 mini 和 GPT-5 nano 之间进行选择。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

抽奖赢3000U,注册Bitget返10%再送6200U!
廣告
分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接