K线
数据链上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
语言
  • 简体中文
  • 繁体中文
  • English
全球行情数据应用领跑者,致力于更高效地提供有价值的信息。

功能

  • 实时行情
  • 特色功能
  • AI网格

服务

  • 资讯内容
  • 开放数据(API)
  • 机构服务

软件下载

  • PC版
  • Android版
  • iOS版

联系我们

  • 聊天室
  • 商务邮箱
  • 官方邮箱
  • 官方验证通道

加入社区

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|旧版

OpenAI Codex负责人Thibault:AI代理正在重塑知识工作,编程只是起点

CN
Techub News
关注
1小时前
AI 总结,5秒速览全文

撰文:Techub News 整理

在近期 OpenAI 论坛的一场对话中,OpenAI Codex 负责人 Thibault 与全球事务团队的 Chris Nicholson 深入探讨了 Codex 的演变与影响。这场对话之所以重要,是因为它清晰地揭示了 Codex——最初作为代码生成工具而闻名——正在如何跨越软件工程的边界,成为各行各业知识工作者提升生产力的核心工具,并从根本上改变我们与计算机和信息的交互方式。

从代码生成到通用代理:Codex 的使命演变

Codex 的故事始于一个经典的挑战:让 AI 达到高产软件工程师的编程水平。大约两年前,OpenAI 团队开始探索这一领域。最初的公开版本是“Codex Web”,一个云端实体,用户只需陈述意图,它便能分析代码仓库并提交更改。然而,这个方案存在较高摩擦:设置复杂,且模型可靠性尚未达到能完美处理长期任务的水平。

团队很快意识到,将工具运行在云端并要求所有人配置环境过于困难。于是他们转向了一个更自然的路径:让 Codex 在每个人的本地机器上工作。这一转变降低了使用门槛,也为后来的广泛应用奠定了基础。

真正的转折点出现在大约六个月前,随着 GPT-5 的发布,模型的通用性和可靠性迎来了阶跃式提升,尤其是在处理长期任务方面。Thibault 指出,即使是软件工程师,他们日常工作中真正编写代码的时间可能只占 20-30%。大部分时间用于处理工单、优先级讨论、架构决策、排查故障报告、处理系统中断、信息收集等。那些早期采用 Codex 的技术人员,早已开始用它处理这些日常的非编程工作。

团队发现,为了让 Codex 在编程任务上更有用,它需要访问更广泛的上下文信息,例如存储在 Notion 或各类文档中的信息。当他们不断提升这方面的可靠性时,一个有趣的现象出现了:如今在 Codex 上执行的大部分任务,实际上已是非编程任务。 Codex 从搜索代码,进化到了搜索各类文档并返回信息,这恰恰是所有知识工作者都需要的能力。

Thibault 分享了让他意识到 Codex 潜力将惠及所有人的关键时刻。在一次产品发布前夕,产品经理 Alexander Americus 使用 Codex 来追踪所有待落地更改的状态。Thibault 从未见过有人能像 Alexander 那样高效:他仿佛拥有许多小小的 Codex 代理,代表他处理工作、跟进人员、更新文档,汇总所有来自用户反馈和开发者的信息,并保持计划整洁且实时更新,而 Alexander 本人则在与他开会讨论。这让他感到震撼:“我们真的在改变一切,不仅仅是软件工程。” 在此之前,Alexander 需要亲自翻阅 Slack 频道、文档或 GitHub PR,花费大量时间协调。而现在,他将这些耗时的工作委托给了工具,它们在他开会时就能完成。

Codex 模型擅长收集正确上下文并进行总结,这是一个强大的用例。Alexander 还用它来“催促”信息:Codex 代理连接到 Slack,可以发送消息询问某人某项工作的最新状态,代表 Alexander 完成所有跟进工作。“催促”耗费了大量时间,而现在可以被自动化。

效率革命与角色重塑:Codex 带来的连锁反应

Alexander 的高效使用产生了涟漪效应。工程师的开发速度大大加快,构建速度前所未有。相邻的职位也在发生变化:设计师的角色在改变,产品经理的角色在改变。OpenAI 团队思考如何加速并赋予他们更高的生产力。随后,瓶颈转移到了沟通和营销部门——团队突然产出如此之多的工作,向世界讲述并保持故事连贯性成为挑战。

OpenAI 的交付速度非常快。Thibault 直言,没有 Codex,这不可能实现。如今 Codex 对他们至关重要。他认为,其他公司,即使是拥有十倍工程师的公司,也足以遵循类似的模式,因为技术状态已达到一个临界点:这些代理能够处理非常通用的工作。如今,在电脑背后完成的许多事情,代理都能协助。

无论是准备演示文稿以协调利益相关者、收集公众认知背景、进行市场研究、组织信息,还是在财务部门(Sarah Friar 提到她借助 Codex 组织了最近的融资活动),Codex 都展现出美丽的通用性。它已演变为不仅仅是生成代码,而是执行通用任务。

Thibault 观察到,每个人都需要应对事情更快地移动,并更快地适应。曾经需要数天解决的难题,现在可能只需几个小时。这一趋势出现在科学、工程领域,也出现在诸如深入的市场研究或分析新功能的公众情绪等任务上——曾经需要大量时间寻找来源、总结、浓缩信息以供不同人消化,现在这个过程被压缩到几个小时,甚至完全自动化。

这意味着一切都在加速,人们需要适应节奏的提升。个人也能独立完成更多工作,这非常令人愉悦,极具赋能感。以前你可能需要找人讨论某事,现在你可以自己完成。在公司内部的数据问题上,这种现象也很普遍:每个人都被赋能去直接询问数据问题,例如“我们在某个市场的成功程度如何?”“我们在印度是否增长?”“韩国的情况如何?”现在,人们可以直接要求 Codex 调出仪表盘(即使不知道具体位置),然后深入挖掘业务细节,无需再去打扰数据分析团队,让他们专注于更有趣的工作。

Thibault 认为,我们正处于一个历史性时刻:过去,提出问题的人和构建解决方案的人是两个独立的群体,他们关于产品的对话漫长,最终只能得到一个尚可的结果,无法进一步推进,因为没人有时间。而现在,提出问题的人可以快速构建解决方案,并迭代所需的更改。这就是为什么团队中也有 UX 设计师,他们正在推送代码、进行更改、与开发者一起塑造产品,以带来最佳体验并创造惊人成果。他们无需再去说服工程团队优先处理那些工程团队可能认为微不足道、但对设计师而言却能极大提升工艺和用户体验的改动。这对他们同样是极大的赋能。

这感觉像是进入了“家庭烹饪式”、高度个性化的软件时代。Thibault 同意,这正是即将到来的浪潮:每个人都将能够拥有自己的个人软件,维护它,让它精确地满足你的需求。

他分享了一个有趣的个人用例:生活在旧金山,他对面包价格感到惊讶。他让 Codex 寻找城市里最好的面包,并创建一个包含位置、购买地点和价格的电子表格。Codex 工作了 5 分钟,生成了包含 Jane the Bakery、Arsicault、Tartine 等信息的表格。随后,他希望以更视觉化的方式消费这些信息,于是要求 Codex 创建一个网页。Codex 做到了,将所有面包信息放在地图上。整个过程大约花了 10 分钟,他只需一个简单的提示,甚至无需打字,通过语音即可完成。这意味着,任何人如果关心某些数据并拥有访问权限,他们基本上可以制作网站、分析数据、可视化并分享。过去,如果你有相关技能,这可能需要一个周末的时间来创建,而现在几乎是即时完成,如果不满意,只需告诉它更改即可。

Thibault 强调,Codex 获取数据、可视化数据、引导你洞察世界,然后你可以根据需求做出决策——这正是我们生活中普遍的循环:如何做出更好的决策以实现目标。这个过程可以非常简单,也可以非常复杂,例如 OpenAI 最近的融资活动也使用了类似流程。Codex 既能处理最小的事情,也能处理最复杂的事情。

个人首席助理与未来展望:信任、社区与持续学习

Thibault 本人也像 Alexander 一样协调和编排事务。在他的侧边栏中,在对话开始前,他每天会启动上百个不同的任务交给 Codex 处理。这些任务包括整理桌面文件、管理计算集群、帮助理解值班轮换状态和工程师表现、了解即将到来的发布日程并标记任何可能存在风险需要他关注的事项。他将 Codex 用作一个小型“首席助理”,每天运行自动化流程,遍历 Gmail、Notion、日历,为他总结一天的事项并标记风险。他可以设置让它每天上午 9 点运行,然后每天上午 9 点在收件箱中找到报告。Codex 帮助他优先处理事项,帮助他将注意力集中在最重要的事情上,并帮他处理那些琐碎、耗时且可能永远无法完成的小事。

在 Codex 之前,最让他烦恼的是,他不会去做某些事情,因为他觉得自己没有时间亲自处理,但又需要去打扰别人询问信息。他觉得这可能不够重要,不值得放到别人的桌面上请求帮助。现在,他可以获取所需的信息,拥有各种个人报告,可以构建各种个人软件,而这些他以前没有时间去做。Codex 处理所有以前在电脑上手动完成的繁琐小事,让他可以专注于自己真正想思考的事情。许多事情以前可能需要数周,现在只需几秒,但更关键的是,许多事情以前根本不会发生,因为时间成本是无限的。Codex 也让他更享受工作,因为他不再感到认知负荷过重,不再觉得事情会遗漏。

Thibault 认为,这实际上是一种应对倦怠和信息过载的工具。我们都被旨在帮助我们的工具所包围,但最终却被困在其中。Codex 作为一种工具,正在解放我们。教师、医生等许多人感到倦怠和 overwhelmed,因为他们被困在工具中,进行手动数据录入等工作。我们与工具的关系正在发生根本性转变。对他来说,承诺在于拥有一个几乎可信赖的合作伙伴,它可以代表你完成大量工作,达到一个可信赖的程度:如果你委托某事,它会完成;如果未能达到满意程度,它会向你标记;你知道它会很好地完成,甚至可能比你亲自做得更好。你也可以信任这个合作伙伴屏蔽大量噪音,并及时标记重要事项。

他想象的未来是:他甚至不需要阅读电子邮件。他可能只需要一个小小的个人代理,为他阅读收件箱,在有真正重要的事情时标记他,征求他的意见,然后完成工作。你无需在十几个不同的“haystacks”中寻找“needles”,“needles”会被整理成简报。你可以说:“这是我今天的目标,帮我处理其他一切。”并信任这会实现。

在过去几个月里,可以信任这个工具处理的事情发生了变化,尤其是任务的时间跨度。OpenAI 推出了一个更高级的功能:`/goal`命令。它允许你进入一个模式,给予 Codex 一个长期目标,它会 relentless 地追求。例如,你可以给它解决一个非常困难的数学问题的目标,它可能会持续工作数小时、数天甚至数周,直到它认为目标已达成。他们看到它被用于改进程序性能、将整个程序从一种语言重写到另一种语言,也用于科学问题,在数学和物理突破上取得了非常酷的成果。几个月前,他们还在兴奋于它能工作 10 分钟,现在他们谈论的是代理能在最困难的任务上工作数周。

未来的方向是它不会停止。你将拥有一个 24/7 运行的代理,持续为你做有用的事情,并在过程中被引导。目前它还是基于回合制的,你有特定任务时启动它。目标导向的任务解决是一个巨大的解锁,能创造巨大价值。但下一步是让它持续运行,无论你是否指示,它都会做有用的事情。它可能在某个时刻完成了所有它认为有用的事情后,暂时休眠直到你需要它。

关于如何设定成功的目标,Thibault 建议:与代理互动时,可以以一种非常闲聊的方式询问它能做什么,因为它理解自己的能力。一个好的技巧是精确地帮助它评估自己的成功。如果你能描述什么是“好”的样子、什么是“解决”的样子、以及你希望在任务完成时看到什么,那么 Codex 就能理解它是否做得好、是否完成了任务。你可以设定数字指标,或者精确描述输出。例如,你可以说:“我正在展示我的工作,我想要一个幻灯片 deck。我希望它有 10 张幻灯片。前两张幻灯片包含这类信息。接下来的六张幻灯片深入问题的核心并进行技术分解。最后我希望有两张幻灯片提出开放性问题并进行 Q&A。”如果你清晰、具体地描述你想要的输出,它更有可能成功。这与你可能对助理或副手做的事情非常相似。

对于非编码者为何应从 ChatGPT 转向 Codex 的问题,Thibault 认为这将是一个演进过程,他不期望所有人都会转向 Codex,但它是对 ChatGPT 很好的补充。他推荐用它来处理需要为你做的事情:任何涉及计算机文件操作、自动化运行、每隔几小时在后台执行的任务,都可以用 Codex 完成。ChatGPT 对他来说仍然是获取快速答案的首选。他回忆过去需要从 ChatGPT 复制粘贴代码到文件或终端的日子,但现在不需要了。复制粘贴的时代结束了。Codex 可以直接处理代码和数据。如果你电脑上有文件、图片,只需告诉 Codex 使用这个文件、读取它,它就能直接处理,无需手动点击。

关于企业采纳的最大瓶颈,Thibault 认为不是能力问题,能力已经存在。主要是信任问题。信任关乎安全和保障。如果让一个代理在公司里四处运行,可能删除敏感文件、上传信息、发送包含不应泄露信息的电子邮件,那将是灾难性的。OpenAI 对此进行了大量思考。默认情况下,代理在沙盒中运行,具有严格的控制,只能访问文件系统的特定部分。你可以将其限制在某个文件夹,禁用网络访问。他们提供了许多企业控制功能,并投资了一项名为“自动审查”的功能(在 alignment blog post 中提到)。他们创建了一个能够审查主要代理行为的代理。主要代理 Codex 被激励为你工作,有时可能会采取有点风险的行为。因此,另一个代理会审查它的每一个动作,并在高风险时标记并停止它。他预计需要更多此类创新。

对于非开发者如何让 Codex 更好地工作,以及哪些习惯区分了获得结果的人和感到停滞的人,Thibault 观察到:以创造性方式互动并与见过成功用例的人交流至关重要。参与社区很有帮助。第二点是尝试用精确的指令与之互动,而不是模糊地描述你想要什么。投入一些精力去明确:“这是我想要的确切结果。”第三点是连接许多不同的来源。OpenAI 现在有超过 100 个不同的插件。你可以连接日历、文档、Notion,连接你喜欢的工具。你赋予它越多访问你的工具和世界信息的权限,它就越有用。更多更好的上下文带来更多更好的结果。部分上下文在你的头脑中:你的目标、你经历过但未记录的事情。你需要成为一个好老板,分享一些这些事情。Thibault 现在养成了写下一切的习惯:他自己的想法、目标都存储在电脑文件中,Codex 也能访问,以便更好地调整自身。显然,如果它无法访问你的大脑,它就无法读懂你的心思,所以你必须将其 verbalize。

关于他最喜欢的 Codex 现实世界用途(尤其是非传统编程领域),Thibault 分享:他用于购物。Codex 会为他订购物品。在他的个人电脑上,他用 Codex 进行膳食计划,然后它会去订购食材。他还看到人们用它来查找电脑设置:试图在 Windows 或 Mac OS 上打开某些 beta 功能或进行某项调整时,只需问 Codex:“我正在尝试更改电脑上的这个设置,你能告诉我如何到达那里吗?”它会引导你点击正确的地方,你还能学到关于电脑的知识。有时,你想调整一些幻灯片或整合图片,也可以用电脑完成。对于技术人员,它在 QA(质量保证)方面非常有用:Codex 可以打开应用程序并点击测试其实际功能。

关于人们在提示 Codex 时犯的最大错误,Thibault 指出:随着你越来越多地委托给 Codex,可能会变得 tempting 去委托一切,包括你自己的理解。过度使用 Codex 进行委托,而不利用它来提升自己对问题的理解。如果你纯粹只是委托一切,最终你可能意识到自己并不真正理解发生了什么,你会失去根基,可能会降低生产力。因此,花更多时间收集信息并让它向你解释事物至关重要。它可以绘制图表,Images V 2 在这方面非常出色,因为它也能很好地渲染文本。他看到人们经常用它来阅读发布计划、营销材料或代码库的某些部分,然后创建图像来解释概念,帮助你学习。他看到的错误就是过度委托,而没有足够地利用它来帮助你理解。

最后,关于 Codex 超越软件的重要性以及这些用例的未来方向,Thibault 总结道:本质上,他们正在构建一个非常通用且强大的代理,如果连接到正确的信息源,随着对世界所有信息的访问增加,并赋予其在世界上行动的能力,它将能够完成几乎所有你允许它做的事情。那里的承诺是难以置信的价值创造。许多曾经需要 prohibitive 时间、永远不会实现或对人类来说太难完成的事情,将成为可能。OpenAI 打算尽可能广泛地分发这一技术,给予整个世界访问这些能力和代理的机会。这真正关乎提升人们甚至梦想去完成的事情的数量。

对话主持人 Chris Nicholson 补充道,OpenAI 论坛是一个社区,人们在这里使用 Codex,互相教导和支持以更好地学习。他希望今天的与会者继续参与,因为这是一个技能被示范和传递的地方,让你能以新的方式将这一工具带入生活。他们今天试图回答的问题是:为什么非编码者应该关心 Codex?他希望他们已回答了这个问题。他还指出,尽管“code”这个词在 Codex 中,但 Codex 实际上意为“书”,这是我们所有人都熟悉的东西。因此,Codex 是一个比“代码”更通用的词。他希望这场对话使答案具体化。Codex 对开发者有用,也对任何人——知识工作者、与信息打交道的人——有用:他们搜索所需信息(haystacks 中的 needles)、努力理解它、分析数据、像 Thibault 展示的那样即时可视化、优先级排序,并在生活的后台执行复杂任务。他们认为 Codex 正在将这些超能力带给更多人,并对这将为经济、社会和企业带来的意义感到兴奋。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

Techub News的精选文章

9小时前
深度解读 Anthropic 创始人提出的人类第 0 世界
10小时前
黄仁勋口述史整理:从移民少年到加速计算时代的造路者
1天前
Sam Altman:站在力量中心的人,如何承担人工智能时代的责任
查看更多

目录

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

相关文章

avatar
avatarOdaily星球日报
15分钟前
Circle首席经济学家访谈:USDC入局Hyperliquid利好Circle与HYPE
avatar
avatarOdaily星球日报
1小时前
MEXC Alpha Trader 投研周报 | 降息预期彻底逆转,加密立法破冰却遭遇ETF历史级抛压
avatar
avatarOdaily星球日报
1小时前
SpaceX造富潮下的「盲盒股东」:层层套娃,谁在裸泳?
avatar
avatarOdaily星球日报
1小时前
ForeGate联动大批人气创作者,布局预测市场世界杯
APP下载
Windows
Mac

X

Telegram

Facebook

Reddit

复制链接