GPT-5 备忘单：关于 OpenAI 最新 AI 飞跃的 13 件事

OpenAI 发布了 GPT-5，在周四的直播中揭晓，标志着该公司所称的人工智能能力的质变，经过几个月的期待和多次延迟。该模型今天将向所有 ChatGPT 用户推出。

此次发布代表了 OpenAI 试图将其各种 AI 技术统一为一个系统。该公司将推理描述为其人工通用智能战略的核心，突破消除了速度与分析深度之间的先前权衡。用户不再需要在快速响应和深度推理能力之间做出选择——GPT-5 同时提供这两者。

以下是您需要了解的要点。

1. 我什么时候能使用？

GPT-5 今天在 ChatGPT 和其 API 上推出。微软也立即将 GPT-5 集成到其产品中，通过 Copilot 和 GitHub Copilot 提供。

如果您已更新带有 Copilot 的 Edge 浏览器，您现在应该可以使用它。

2. 每个人都能得到相同的版本吗？

是的，算是：免费用户将从标准的 GPT-5 开始，使用配额耗尽后将过渡到更轻的“GPT-5 mini”版本。专业订阅用户（每月 200 美元）可以无限制访问完整模型，而 Plus 订阅用户（每月 20 美元）可以访问标准的 GPT-5。

专业订阅用户可以以最高智能水平运行 GPT-5，并享有额外功能，如提前访问其高级代理、无限使用、更深层次研究的更多能力、优先访问以及更高限制的视频和屏幕共享的高级语音模式。

3. 多模态是什么意思？是否会取消单独的图像生成器？

多模态意味着 GPT-5 可以处理和生成不同类型的内容——文本、图像、语音，甚至现在的视频——所有这些都在同一对话中进行。该模型在复杂任务中展示了增强的外语理解能力，能够生成包含法语单词和正确发音的完整网站。

GPT-5 可以独立完成所有任务，而不需要在 Vision、Sora、GPT 和“o”模型之间切换进行推理。

4. 上下文窗口有多大，为什么这很重要？

GPT-5 的输入上下文窗口为 256,000 个标记，API 接受最多 272,000 个输入标记，并发出最多 128,000 个推理和输出标记，总上下文长度为 400,000 个标记。

这意味着它可以一次处理大约 200,000 个单词——相当于一本长小说。更大的上下文窗口使 GPT-5 能够在更长的交互中保持连贯的对话，并分析整个代码库或冗长的文档，而不会丢失重要细节。

也就是说，按照今天的标准，这个窗口并不算大。仅供参考，Gemini 2.5 能够处理 100 万个标记。

5. 它有什么新功能？

实际上没有，但它的一些技能升级到如此程度，以至于它们会感觉像新功能。

6. 那么它有什么特别之处？

GPT-5 在几乎所有方面都更强大。例如，在演示中，它展示了出色的编码能力，在被要求从头创建一个伯努利效应模拟时，在两分钟内编写了超过 400 行代码。演示中展示的其他酷炫功能：

语音交互听起来不那么机械，并引入了与竞争对手如 Gemini Live 相匹配的实时视频功能。
该模型现在可以分析上传的图像并将其纳入响应中。
它在代理任务方面表现更好，并且据说能够处理现实世界的应用并解释其推理。
下周用户将能够集成 Gmail 和 Google 日历，这将使其成为更好的助手。

7. 定价有变化吗？

ChatGPT 的订阅定价保持不变，Plus 每月 20 美元，Pro 每月 200 美元。

对于 API 用户，标准模型的 GPT-5 每百万输入标记收费 1.25 美元，每百万输出标记收费 10.00 美元。GPT-5 mini 每百万输入标记收费 0.25 美元，每百万输出标记收费 2.00 美元，而 GPT-5 nano 的输入费用为 0.05 美元，输出费用为 0.40 美元。

这使得该模型在与其他公司的产品竞争时具有优势，甚至比 OpenAI 的其他模型如 GPT-4.1 或 OpenAI o1 pro（每百万标记高达 600 美元）更便宜。

8. 我们已经达到了 AGI 吗？

没有。然而，该公司将推理定位为“我们 AGI 计划的核心”。

该模型代表了显著的进步，但仍然专注于特定任务，而不是在所有领域与人类智能相匹配。例如，GPT-5 在语言任务方面表现出色，但缺乏独立执行广泛活动所需的通用智能。它尚未具备自我学习或自我适应的能力。

9. GPT-5 能生成视频吗？

还不能。虽然视频生成未包含在初始发布中，但 OpenAI 有 Sora 作为单独的视频创作产品。

首席执行官 Sam Altman 之前表示，未来版本将“最终”支持视频。

不过，当前版本确实理解实时视频，因此它可以观看您尝试修理自行车并提供实时指导。

10. 与之前的模型相比，它的可靠性如何？

OpenAI 报告称，GPT-5 “明显不那么具误导性”，解决了大型语言模型部署中最持久的挑战之一。

在事实准确性基准测试中，GPT-5 的事实错误大约比 o3 少 80%，根据 OpenAI 首席科学家 Jakub Pachocki 的说法，使其在企业应用中更值得信赖。

11. 关于记忆和个性化呢？

GPT-5 据说将在会话之间提供更好的持久记忆，记住多个对话中的事实、偏好和指令，即使您关闭应用程序并在几天后打开新标签页。GPT-4 的记忆有限，尤其是在会话暂停几天后。

该公司表示，您现在可以设定长期目标（例如，帮助我以健康的方式减掉 10 磅，或帮助我准备物理考试），GPT-5 将相应调整其响应，以主动与您的目标保持一致。

12. 我的个人数据有多私密？

Altman 之前承认，如果法律要求，OpenAI 可能需要向政府交出用户的个人数据。

13. 我还需要在不同模型之间切换吗？

不再需要——除非您想通过 Sora 生成视频。随着 GPT-5 的推出，OpenAI 表示有信心弃用所有先前的模型。

该公司设计 GPT-5 以处理所有以前需要专门模型的用例，尽管用户仍然可以根据速度和成本要求在 GPT-5、GPT-5 mini 和 GPT-5 nano 之间进行选择。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。