AI Trading 的新坐标系：To-Agent Harness

下一代 AI 基础设施，就是 Agent Harness。

撰文：Zoey Zhou，Foresight Ventures

过去两年，AI 行业几乎被一个问题主导：谁的模型更强？

这个问题当然重要。模型能力的提升，是这一轮 AI 浪潮的起点。但当模型逐渐成为所有产品和工作流的底层能力之后，竞争的焦点也开始变化。越来越多公司发现，真正困难的地方并不只是让模型回答得更好，而是让它在真实环境里稳定、可信、持续地完成任务。

这也是我们最近越来越关注 Agent Harness 的原因。

如果说模型是 agent 的大脑，那么 Harness 就是让这个大脑真正进入世界、开始工作的系统。它包含上下文、工具、运行环境、权限、风控、评估、追踪和反馈。没有这些东西，模型再强，也只能停留在对话框里；有了这些东西，agent 才能从「会回答」走向「能执行」。

这篇文章讨论的不是又一个 agent 应用机会，而是一个更底层的问题：当软件世界开始为 agent 重写，哪些基础设施会变得重要？哪些机会值得投资？哪些看起来很热，但可能很难形成长期壁垒？

我们会先从 To-Agent 这个新坐标系讲起，再讨论为什么 Harness 会成为 agent 经济的关键层，以及我们看到的投资机会和风险；最后用 trading agent 作为一个垂直场景，说明为什么执行轨迹和结果反馈可能成为下一代 AI 基础设施里最有价值的数据资产。

一、从 To-B / To-C 到 To-Agent

互联网时代的很多判断框架，今天正在变得不够用。

过去我们判断一个产品，习惯先问它是 To-B 还是 To-C，DAU 多少，留存怎样，流量从哪里来，付费转化如何。这套方法之所以有效，是因为软件的第一用户一直是人。人打开 App，阅读界面，点击按钮，做出判断，再完成动作。

但 agent 时代正在改变这个假设。

越来越多场景里，真正进入系统、读取信息、调用工具、发起操作的，已经不再直接是人，而是代表人或组织行动的 agent。它不关心页面设计得漂不漂亮，也不需要传统意义上的用户手册。它关心的是 API 是否清楚，schema 是否结构化，权限边界是否明确，工具描述是否可读，执行结果是否能被验证。

这不是一个小的交互变化，而是接口假设的替换。

过去软件是写给人看的，所以我们优化页面、按钮、文案和流程；现在越来越多系统开始需要写给 agent 用，所以它必须变得可调用、可组合、可验证、可追踪。

因此，To-B 和 To-C 之外，一个新的维度正在变得重要：To-Agent。

To-Agent 并不是说人不重要了，而是说很多产品的直接使用者、调用者、执行者会变成 agent。最终买单的可能还是企业或个人，但产品是否能被 agent 发现、调用和持续使用，会成为新的分发入口。

这对投资判断影响很大。一个产品可能没有传统意义上的高 DAU，但如果它成为大量 agents 的默认调用层，它的价值会非常高。反过来，一个面向人类用户看起来很完整的产品，如果不能被 agent 读取、调用和组合，未来可能会被新的基础设施绕过。

这也是为什么我们认为，agent 时代的第一张新地图，不是 To-B / To-C，而是 To-Human / To-Agent。前者服务人，提高人的效率；后者服务 agent，让 agent 能发现、理解、调用、执行、支付、验证和复盘。

二、巨头们争的不是模型功能，而是 Agent 入口

过去一年，几家头部公司的动作看起来各不相同：有人做协议，有人做 skills，有人做 agent builder，有人做支付轨道，有人做钱包工具。单独看，这些像是分散的功能发布；放在一起看，它们其实在争同一个位置：agent 进入真实系统的入口。

Anthropic 是最清晰的例子。

MCP 解决的是 agent 如何连接外部系统。Anthropic 在发布 MCP 时，将其定义为一个开放标准，用于在 AI-powered tools 与外部数据源之间建立安全的双向连接。换句话说，MCP 想解决的不是聊天体验，而是 agent 如何进入数据源、开发环境和业务系统。

Agent Skills 解决的是另一个问题：agent 如何获得专业工作流。Anthropic 对 Skills 的解释很直观，它把构建 skill 类比成给新员工写 onboarding guide；一个 skill 可以包含指令、脚本、参考材料和流程，让 agent 在特定任务上表现得更稳定、更可复用。

Claude Code 的意义也在这里。它不是一个简单的 coding assistant，而是一个长任务执行系统。它能读代码、改文件、调用工具、跑测试、处理错误，并在任务没有完成时继续循环。Coding 是 agent 最早被完整验证的工作流之一，因为它天然有结构化环境、明确反馈、可执行工具和相对清晰的结果验证。

Anthropic 的崛起，很大程度上并不是因为它做了更多功能，而是因为它更早把 agent 当成长任务执行系统来设计。它的核心优势不只在模型，也在模型周围那套让执行发生的系统。

OpenAI 的 AgentKit 也在往这个方向走。它把构建、部署和优化 agents 所需的工具整合起来，试图降低企业和开发者从 prototype 到 production 的难度。这里面的关键词不是聊天，而是 builder、connectors、eval、deployment 和 optimization。OpenAI 对 AgentKit 的介绍，也明确围绕帮助 developers and enterprises build, deploy, and optimize agents 展开。

Coinbase 和 Cloudflare 推动 x402，则说明 agent 经济不仅需要工具调用，也需要支付和结算轨道。Coinbase 在介绍 x402 Foundation 时提到，x402 通过 HTTP 「402 Payment Required」状态码把支付嵌入 web interactions，使 AI agents、APIs 和 apps 能像交换数据一样完成价值交换。Cloudflare 也将 x402 描述为一个让 clients 和 services 用共同语言交换价值的框架。Coinbase AgentKit 则进一步把钱包和链上交互变成 AI agents 可以调用的组件，强调 framework-agnostic 和 wallet-agnostic 的 crypto-native agent 工具包。

Bitget 的动作，则代表了 trading agent 这一垂直场景里的另一种入口争夺。与 x402 更偏支付协议、AgentKit 更偏链上钱包和 onchain interactions 不同，Bitget Agent Hub 更直接面向交易执行场景。Bitget 将 MCP、API、Skills 和 CLI 组合成一套 invocation system，用来连接 AI models、development tools 和 live trading execution chains。 Agent Hub 定位为 AI-era crypto trading infrastructure，面向 developers 和 Vibe Coders 提供 trading capabilities。

这件事的意义不只是「交易所多做了几个 AI 工具」。更准确地说，Bitget 正在尝试回答一个更具体的问题：如果 trading agent 要真正进入 CEX 场景，它需要怎样的一整套 harness？它需要工具、接口、策略 skills、命令行调用、权限隔离，也需要未来进一步的执行轨迹、结果评估和风控反馈。Bitget 已经走出第一步，但这条路还没有行业标准。谁能把从发现、接入、授权、执行、验证到复盘的链条做得更完整，谁就更可能在 trading agent 这个高价值场景里获得入口位置。

这些动作放在一起看，说明 AI 基础设施正在从 Model Stack 扩展到 Agent Stack。未来的竞争，不只是模型能力，也包括 agent 如何连接系统、获得权限、调用工具、支付、执行、验证和学习。

这也引出了本文最核心的问题：当 agent 不再只是聊天窗口，而是开始进入真实系统执行任务，中间到底缺什么？

三、从会回答到能执行，中间缺的是 Harness

理解 agent 时代，可以先记住一个简单公式：

Model 提供智能，Harness 提供执行系统。

过去大家把注意力集中在 model 上，这是合理的。没有足够强的模型，就没有今天的 agent。但随着模型能力持续提升，很多瓶颈开始转移。企业真正关心的问题变成：这个 agent 能不能接进我的系统？能不能拿到合适权限？出了错能不能追责？执行过程能不能看见？结果好不好谁来判断？能不能从失败中学习？

这些问题都属于 Harness。

一个完整的 Harness，不只是一个工具调用框架。Agent 需要 context，知道当前任务、业务背景、历史状态和组织规则。它需要 tools 和 skills，能调用外部系统，也能复用某个领域沉淀下来的工作流。它需要 runtime 和 orchestration，能处理长任务、多步骤执行、失败恢复和并行协作。它需要 identity 和 permission，明确自己代表谁、能做什么、不能做什么。它还需要 guardrails、evaluation、trace 和 feedback，把执行过程记录下来，判断结果好坏，并让下一次执行更好。

这也是为什么我们倾向于把 Harness 看作 OS 层，而不是普通 SaaS 功能。

今天市场上已经有很多单点产品：做 memory 的，做 tool calling 的，做 orchestration 的，做 observability 的，做 eval 的。它们都有价值，也会在早期阶段跑出不少好公司。但从长期看，agent 的风险和价值都来自闭环。单独一层如果不能和其他层结合，很容易变成过渡工具。

工具没有权限和风控，自动化越强风险越大。追踪没有身份和授权，收集到的只是低质量日志。编排没有评估，agent 可能一路自信地错下去。记忆没有反馈，context 会越塞越脏。评估如果不能影响运行时决策，也只能停留在事后打分。

操作系统的价值从来不是某一个模块，而是各个模块之间形成稳定的协同。Agent Harness 也是一样。

四、我们怎么看投资机会

在这个框架下，Agent Harness 不是一个单一赛道，而是一组基础设施机会。

第一类机会在 discovery 和 protocol 层。Agent 需要找到外部系统，理解它们能做什么，并以标准方式调用。MCP server、tool registry、skill marketplace、structured documentation、machine-readable API，都会成为新的分发入口。这里的机会很大，但也容易被高估。单纯做目录或协议，本身不一定能沉淀长期价值。真正有价值的是协议之上的 usage、workflow 和数据。

第二类机会在 context 和 skill 层。通用模型知道很多，但真实工作依赖大量组织和行业上下文。法律、金融、医疗、安全、芯片设计、审计、供应链，每个行业都有自己的流程、术语、模板、合规要求和例外情况。谁能把这些经验结构化成 agent 可用的 context 和 skills，谁就可能在垂直领域形成壁垒。

第三类机会在 runtime 和 orchestration 层。Agent 要完成长任务，需要状态管理、失败恢复、成本控制、沙盒环境和多 agent 协同。这一层需求确定，但竞争会很激烈。模型公司、云厂商和开源框架都会进入。我们更关注那些抓住具体高价值场景的团队，而不是泛泛做一个 workflow builder 的公司。

第四类机会在 evaluation、observability 和 trace。我们认为这是被低估的一层。很多 agent 项目失败，并不是模型完全不能做，而是企业不知道它为什么做、做到了哪一步、哪里出错、成本花在哪里、结果是否可信。Trace 和 eval 短期看像开发者工具，长期看可能是 agent 时代的数据基础设施。只有 trace，没有 eval，只是日志；trace 和 eval 结合起来，才可能变成训练和判断系统。

第五类，也是我们最看好的，是 vertical harness。它不是做一个垂直 agent app，而是在一个高价值领域里，把 context、tools、workflow、permission、guardrails、evaluation、trace 和 feedback loop 串起来。法律、医疗、金融、交易、安全、芯片设计这类领域尤其适合，因为它们任务价值高、错误成本高、流程深、结果可评估，而且数据闭环非常有价值。

相应地，我们对几类方向保持谨慎。

Generic agent framework 看起来位置很大，但上面会被模型公司 managed agents 往下压，下面会被垂直 workflow 公司往上吃。如果没有强生态、强分发或真实执行数据，中间层很难长期防守。

纯模型套壳应用也需要谨慎。没有 workflow ownership、没有独家 context、没有 execution data、没有分发壁垒的应用，会越来越容易被模型升级和平台能力吞掉。

协议叙事也不能只看热度。MCP、x402、A2A 这些方向都值得跟踪，但协议本身不是商业模式。最终要看真实开发者采用、调用量、是否进入主流 agent builder，以及是否能参与实际执行链条。

最后是数据飞轮。很多公司会讲自己有数据飞轮，但真正的数据飞轮必须有数据权利、结构化 schema 和 evaluation label。没有用户授权和合规边界的数据收集，最后可能不是壁垒，而是风险。

五、Trading Agent 是 Harness 的压力测试

Trading agent 是理解 Agent Harness 最好的垂直案例之一。

原因很简单：交易场景把 Harness 的所有问题一次性放大了。

交易涉及真实资金，错误成本高，执行需要授权，风控必须实时，过程需要审计，结果可以量化，市场 7×24 运行。一个 trading agent 的价值，不能只看它能不能下单。更重要的是，它是否知道自己代表谁，能访问哪个账户，能承受多大风险，能交易哪些品种，什么时候必须停下来，以及执行结果到底好不好。

因此，一个成熟的 Trading Agent Harness 应该包含完整链条。

Agent 首先要能发现交易系统，理解接口和工具。接着需要身份和权限，知道它代表谁、能做什么。然后才是行情、账户、下单、撤单、仓位、止损、对冲等工具调用。更进一步，它需要把交易任务拆成研究、计划、执行和验证几个阶段，避免同一个 agent 同时拥有过高权限和自我评估权。

风控是 trading agent 的核心。预算上限、最大杠杆、最大回撤、品种限制、频率限制、异常熔断，都必须写进系统，而不是靠事后提醒。评估也不能只看 PnL。短期赚钱可能来自过度冒险，短期亏损也可能是正确风控。更合理的评估应该包括滑点、风险调整后收益、是否遵守用户目标、是否在极端行情中做出异常行为。

最重要的是 trace。

每一次 agent 交易，都会产生一条轨迹：市场状态、决策过程、工具调用、风控检查、执行动作、成交结果和后续归因。普通交易日志只记录发生了什么，trading agent trace 还记录为什么这样做，以及结果如何。

这就是我们说的：Harness 本身就是 Dataset。

如果未来出现某种 Transaction Foundation Model，它需要的不会只是行情和成交数据，而是带有策略意图、风险边界、执行路径和结果标签的交易轨迹。这样的数据必须来自真实执行，也必须从第一天就按可复用 schema 设计。否则三年后回头看，可能只是堆了很多无法训练的日志。

这也是为什么 trading agent 的竞争，长期可能从 API competition 走向 execution data competition。

六、交易所的位置与 Bitget 的早期探索

在 trading agent 这个场景里，交易所处在一个很特殊的位置。

模型公司可以提供 reasoning，中间件公司可以提供 workflow，钱包可以提供签名和链上权限，云平台可以提供 runtime。但中心化交易所掌握的是另一组资产：托管账户、订单和成交数据、市场深度、风控系统、清算系统、权限体系和 7×24 运行基础设施。

这些资产让交易所具备构建 Trading Agent Harness 的结构性机会。它们离真实执行和真实结果最近，也最有可能沉淀高质量的 execution data。

当然，这并不意味着交易所天然会赢。交易所通常不擅长开发者生态，文档和 API 体验未必 agent-friendly，合规要求会让产品迭代更谨慎，用户对自动交易的信任也需要慢慢建立。更重要的是，交易数据的使用必须有严格的授权、匿名化、隐私和合规设计。

所以交易所如果要进入 agent 时代，不能只把 API 暴露出去。它需要完成一次更深的升级：从 execution backend 走向 trusted harness layer。

Bitget 是这个方向里的一个早期案例。Bitget Agent Hub 已经围绕 MCP、API、Skills、CLI 等模块展开，试图连接 AI models、developer tools 和真实交易执行，让开发者和 AI agents 可以访问市场数据、运行策略并执行交易。Bitget 也披露过 Agent Hub 覆盖多个能力模块和 58 个工具，包括现货、合约、跟单和理财等方向。

这说明 Bitget 已经走出了第一步：让交易所能力对 agent 更可见、更可调用。

但从行业角度看，这仍然只是早期阶段。工具暴露只是起点，真正的分水岭在后面。一个交易所能不能成为 Trading Agent Harness，要看它能否解决几个更深的问题：agent 能不能默认发现它，key 和签名边界是否清楚，权限是否足够精细，交易行为是否可追踪，结果是否可验证，失败是否能写回 guardrails，execution trace 是否能形成数据资产。

如果 Bitget 或其他交易所能继续向 trace、evaluation、guardrails、KYA 和 feedback loop 演进，交易所竞争可能会从流动性、产品深度和用户规模，进一步扩展到 agent-native trust 和 execution data。

这会是一个比「谁有更多 MCP 和 Skills」更重要的问题。

结语：下一代 AI 基础设施，就是 Agent Harness

Agent 时代的真正变化，不是 AI 会说得更好，而是 AI 开始做事。

一旦 AI 开始做事，基础设施就会被重写。它需要发现工具，获得权限，调用系统，完成支付，执行动作，接受审计，被评估，并从失败中改进。

这些能力加在一起，就是 Agent Harness。

从投资角度看，我们更关注那些能进入高价值工作流、持续沉淀 context、workflow、trace、evaluation 和 outcome data 的公司。它们未必一开始看起来最热，也未必有最漂亮的前端产品，但如果它们站在正确的位置上，可能会成为 agent 时代真正的基础设施。

Trading agent 只是其中一个案例。类似的逻辑也会在法律、医疗、安全、芯片设计、企业合规和金融工作流里发生。

未来的 AI 竞争，会经历三次迁移。

第一阶段，比谁的模型更强。

第二阶段，比谁能让 agent 更可靠地完成真实工作。

第三阶段，比谁能把每一次执行，沉淀成下一次更好执行的数据资产。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。