K線
數據鏈上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
語言
  • 简体中文
  • 繁体中文
  • English
全球行情資料應用程式領跑者,致力於更有效率地提供有價值的資訊。

功能

  • 即時行情
  • 特色功能
  • AI網格

服務

  • 資訊內容
  • 開放數據(API)
  • 機構服務

軟體下載

  • PC版
  • Android版
  • iOS版

聯絡我們

  • 聊天室
  • 商務信箱
  • 官方信箱
  • 官方驗證通道

加入社區

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|舊版

AI Trading 的新坐标系:To-Agent Harness

CN
Foresight News
關注
1 小時前
AI 總結,5秒速覽全文
下一代 AI 基础设施,就是 Agent Harness。

撰文:Zoey Zhou,Foresight Ventures

过去两年,AI 行业几乎被一个问题主导:谁的模型更强?

这个问题当然重要。模型能力的提升,是这一轮 AI 浪潮的起点。但当模型逐渐成为所有产品和工作流的底层能力之后,竞争的焦点也开始变化。越来越多公司发现,真正困难的地方并不只是让模型回答得更好,而是让它在真实环境里稳定、可信、持续地完成任务。

这也是我们最近越来越关注 Agent Harness 的原因。

如果说模型是 agent 的大脑,那么 Harness 就是让这个大脑真正进入世界、开始工作的系统。它包含上下文、工具、运行环境、权限、风控、评估、追踪和反馈。没有这些东西,模型再强,也只能停留在对话框里;有了这些东西,agent 才能从「会回答」走向「能执行」。

这篇文章讨论的不是又一个 agent 应用机会,而是一个更底层的问题:当软件世界开始为 agent 重写,哪些基础设施会变得重要?哪些机会值得投资?哪些看起来很热,但可能很难形成长期壁垒?

我们会先从 To-Agent 这个新坐标系讲起,再讨论为什么 Harness 会成为 agent 经济的关键层,以及我们看到的投资机会和风险;最后用 trading agent 作为一个垂直场景,说明为什么执行轨迹和结果反馈可能成为下一代 AI 基础设施里最有价值的数据资产。

一、从 To-B / To-C 到 To-Agent

互联网时代的很多判断框架,今天正在变得不够用。

过去我们判断一个产品,习惯先问它是 To-B 还是 To-C,DAU 多少,留存怎样,流量从哪里来,付费转化如何。这套方法之所以有效,是因为软件的第一用户一直是人。人打开 App,阅读界面,点击按钮,做出判断,再完成动作。

但 agent 时代正在改变这个假设。

越来越多场景里,真正进入系统、读取信息、调用工具、发起操作的,已经不再直接是人,而是代表人或组织行动的 agent。它不关心页面设计得漂不漂亮,也不需要传统意义上的用户手册。它关心的是 API 是否清楚,schema 是否结构化,权限边界是否明确,工具描述是否可读,执行结果是否能被验证。

这不是一个小的交互变化,而是接口假设的替换。

过去软件是写给人看的,所以我们优化页面、按钮、文案和流程;现在越来越多系统开始需要写给 agent 用,所以它必须变得可调用、可组合、可验证、可追踪。

因此,To-B 和 To-C 之外,一个新的维度正在变得重要:To-Agent。

To-Agent 并不是说人不重要了,而是说很多产品的直接使用者、调用者、执行者会变成 agent。最终买单的可能还是企业或个人,但产品是否能被 agent 发现、调用和持续使用,会成为新的分发入口。

这对投资判断影响很大。一个产品可能没有传统意义上的高 DAU,但如果它成为大量 agents 的默认调用层,它的价值会非常高。反过来,一个面向人类用户看起来很完整的产品,如果不能被 agent 读取、调用和组合,未来可能会被新的基础设施绕过。

这也是为什么我们认为,agent 时代的第一张新地图,不是 To-B / To-C,而是 To-Human / To-Agent。前者服务人,提高人的效率;后者服务 agent,让 agent 能发现、理解、调用、执行、支付、验证和复盘。

二、巨头们争的不是模型功能,而是 Agent 入口

过去一年,几家头部公司的动作看起来各不相同:有人做协议,有人做 skills,有人做 agent builder,有人做支付轨道,有人做钱包工具。单独看,这些像是分散的功能发布;放在一起看,它们其实在争同一个位置:agent 进入真实系统的入口。

Anthropic 是最清晰的例子。

MCP 解决的是 agent 如何连接外部系统。Anthropic 在发布 MCP 时,将其定义为一个开放标准,用于在 AI-powered tools 与外部数据源之间建立安全的双向连接。换句话说,MCP 想解决的不是聊天体验,而是 agent 如何进入数据源、开发环境和业务系统。

Agent Skills 解决的是另一个问题:agent 如何获得专业工作流。Anthropic 对 Skills 的解释很直观,它把构建 skill 类比成给新员工写 onboarding guide;一个 skill 可以包含指令、脚本、参考材料和流程,让 agent 在特定任务上表现得更稳定、更可复用。

Claude Code 的意义也在这里。它不是一个简单的 coding assistant,而是一个长任务执行系统。它能读代码、改文件、调用工具、跑测试、处理错误,并在任务没有完成时继续循环。Coding 是 agent 最早被完整验证的工作流之一,因为它天然有结构化环境、明确反馈、可执行工具和相对清晰的结果验证。

Anthropic 的崛起,很大程度上并不是因为它做了更多功能,而是因为它更早把 agent 当成长任务执行系统来设计。它的核心优势不只在模型,也在模型周围那套让执行发生的系统。

OpenAI 的 AgentKit 也在往这个方向走。它把构建、部署和优化 agents 所需的工具整合起来,试图降低企业和开发者从 prototype 到 production 的难度。这里面的关键词不是聊天,而是 builder、connectors、eval、deployment 和 optimization。OpenAI 对 AgentKit 的介绍,也明确围绕帮助 developers and enterprises build, deploy, and optimize agents 展开。

Coinbase 和 Cloudflare 推动 x402,则说明 agent 经济不仅需要工具调用,也需要支付和结算轨道。Coinbase 在介绍 x402 Foundation 时提到,x402 通过 HTTP 「402 Payment Required」 状态码把支付嵌入 web interactions,使 AI agents、APIs 和 apps 能像交换数据一样完成价值交换。Cloudflare 也将 x402 描述为一个让 clients 和 services 用共同语言交换价值的框架。Coinbase AgentKit 则进一步把钱包和链上交互变成 AI agents 可以调用的组件,强调 framework-agnostic 和 wallet-agnostic 的 crypto-native agent 工具包。

Bitget 的动作,则代表了 trading agent 这一垂直场景里的另一种入口争夺。与 x402 更偏支付协议、AgentKit 更偏链上钱包和 onchain interactions 不同,Bitget Agent Hub 更直接面向交易执行场景。Bitget 将 MCP、API、Skills 和 CLI 组合成一套 invocation system,用来连接 AI models、development tools 和 live trading execution chains。 Agent Hub 定位为 AI-era crypto trading infrastructure,面向 developers 和 Vibe Coders 提供 trading capabilities。

这件事的意义不只是「交易所多做了几个 AI 工具」。更准确地说,Bitget 正在尝试回答一个更具体的问题:如果 trading agent 要真正进入 CEX 场景,它需要怎样的一整套 harness?它需要工具、接口、策略 skills、命令行调用、权限隔离,也需要未来进一步的执行轨迹、结果评估和风控反馈。Bitget 已经走出第一步,但这条路还没有行业标准。谁能把从发现、接入、授权、执行、验证到复盘的链条做得更完整,谁就更可能在 trading agent 这个高价值场景里获得入口位置。

这些动作放在一起看,说明 AI 基础设施正在从 Model Stack 扩展到 Agent Stack。未来的竞争,不只是模型能力,也包括 agent 如何连接系统、获得权限、调用工具、支付、执行、验证和学习。

这也引出了本文最核心的问题:当 agent 不再只是聊天窗口,而是开始进入真实系统执行任务,中间到底缺什么?

三、从会回答到能执行,中间缺的是 Harness

理解 agent 时代,可以先记住一个简单公式:

Model 提供智能,Harness 提供执行系统。

过去大家把注意力集中在 model 上,这是合理的。没有足够强的模型,就没有今天的 agent。但随着模型能力持续提升,很多瓶颈开始转移。企业真正关心的问题变成:这个 agent 能不能接进我的系统?能不能拿到合适权限?出了错能不能追责?执行过程能不能看见?结果好不好谁来判断?能不能从失败中学习?

这些问题都属于 Harness。

一个完整的 Harness,不只是一个工具调用框架。Agent 需要 context,知道当前任务、业务背景、历史状态和组织规则。它需要 tools 和 skills,能调用外部系统,也能复用某个领域沉淀下来的工作流。它需要 runtime 和 orchestration,能处理长任务、多步骤执行、失败恢复和并行协作。它需要 identity 和 permission,明确自己代表谁、能做什么、不能做什么。它还需要 guardrails、evaluation、trace 和 feedback,把执行过程记录下来,判断结果好坏,并让下一次执行更好。

这也是为什么我们倾向于把 Harness 看作 OS 层,而不是普通 SaaS 功能。

今天市场上已经有很多单点产品:做 memory 的,做 tool calling 的,做 orchestration 的,做 observability 的,做 eval 的。它们都有价值,也会在早期阶段跑出不少好公司。但从长期看,agent 的风险和价值都来自闭环。单独一层如果不能和其他层结合,很容易变成过渡工具。

工具没有权限和风控,自动化越强风险越大。追踪没有身份和授权,收集到的只是低质量日志。编排没有评估,agent 可能一路自信地错下去。记忆没有反馈,context 会越塞越脏。评估如果不能影响运行时决策,也只能停留在事后打分。

操作系统的价值从来不是某一个模块,而是各个模块之间形成稳定的协同。Agent Harness 也是一样。

四、我们怎么看投资机会

在这个框架下,Agent Harness 不是一个单一赛道,而是一组基础设施机会。

第一类机会在 discovery 和 protocol 层。Agent 需要找到外部系统,理解它们能做什么,并以标准方式调用。MCP server、tool registry、skill marketplace、structured documentation、machine-readable API,都会成为新的分发入口。这里的机会很大,但也容易被高估。单纯做目录或协议,本身不一定能沉淀长期价值。真正有价值的是协议之上的 usage、workflow 和数据。

第二类机会在 context 和 skill 层。通用模型知道很多,但真实工作依赖大量组织和行业上下文。法律、金融、医疗、安全、芯片设计、审计、供应链,每个行业都有自己的流程、术语、模板、合规要求和例外情况。谁能把这些经验结构化成 agent 可用的 context 和 skills,谁就可能在垂直领域形成壁垒。

第三类机会在 runtime 和 orchestration 层。Agent 要完成长任务,需要状态管理、失败恢复、成本控制、沙盒环境和多 agent 协同。这一层需求确定,但竞争会很激烈。模型公司、云厂商和开源框架都会进入。我们更关注那些抓住具体高价值场景的团队,而不是泛泛做一个 workflow builder 的公司。

第四类机会在 evaluation、observability 和 trace。我们认为这是被低估的一层。很多 agent 项目失败,并不是模型完全不能做,而是企业不知道它为什么做、做到了哪一步、哪里出错、成本花在哪里、结果是否可信。Trace 和 eval 短期看像开发者工具,长期看可能是 agent 时代的数据基础设施。只有 trace,没有 eval,只是日志;trace 和 eval 结合起来,才可能变成训练和判断系统。

第五类,也是我们最看好的,是 vertical harness。它不是做一个垂直 agent app,而是在一个高价值领域里,把 context、tools、workflow、permission、guardrails、evaluation、trace 和 feedback loop 串起来。法律、医疗、金融、交易、安全、芯片设计这类领域尤其适合,因为它们任务价值高、错误成本高、流程深、结果可评估,而且数据闭环非常有价值。

相应地,我们对几类方向保持谨慎。

Generic agent framework 看起来位置很大,但上面会被模型公司 managed agents 往下压,下面会被垂直 workflow 公司往上吃。如果没有强生态、强分发或真实执行数据,中间层很难长期防守。

纯模型套壳应用也需要谨慎。没有 workflow ownership、没有独家 context、没有 execution data、没有分发壁垒的应用,会越来越容易被模型升级和平台能力吞掉。

协议叙事也不能只看热度。MCP、x402、A2A 这些方向都值得跟踪,但协议本身不是商业模式。最终要看真实开发者采用、调用量、是否进入主流 agent builder,以及是否能参与实际执行链条。

最后是数据飞轮。很多公司会讲自己有数据飞轮,但真正的数据飞轮必须有数据权利、结构化 schema 和 evaluation label。没有用户授权和合规边界的数据收集,最后可能不是壁垒,而是风险。

五、Trading Agent 是 Harness 的压力测试

Trading agent 是理解 Agent Harness 最好的垂直案例之一。

原因很简单:交易场景把 Harness 的所有问题一次性放大了。

交易涉及真实资金,错误成本高,执行需要授权,风控必须实时,过程需要审计,结果可以量化,市场 7×24 运行。一个 trading agent 的价值,不能只看它能不能下单。更重要的是,它是否知道自己代表谁,能访问哪个账户,能承受多大风险,能交易哪些品种,什么时候必须停下来,以及执行结果到底好不好。

因此,一个成熟的 Trading Agent Harness 应该包含完整链条。

Agent 首先要能发现交易系统,理解接口和工具。接着需要身份和权限,知道它代表谁、能做什么。然后才是行情、账户、下单、撤单、仓位、止损、对冲等工具调用。更进一步,它需要把交易任务拆成研究、计划、执行和验证几个阶段,避免同一个 agent 同时拥有过高权限和自我评估权。

风控是 trading agent 的核心。预算上限、最大杠杆、最大回撤、品种限制、频率限制、异常熔断,都必须写进系统,而不是靠事后提醒。评估也不能只看 PnL。短期赚钱可能来自过度冒险,短期亏损也可能是正确风控。更合理的评估应该包括滑点、风险调整后收益、是否遵守用户目标、是否在极端行情中做出异常行为。

最重要的是 trace。

每一次 agent 交易,都会产生一条轨迹:市场状态、决策过程、工具调用、风控检查、执行动作、成交结果和后续归因。普通交易日志只记录发生了什么,trading agent trace 还记录为什么这样做,以及结果如何。

这就是我们说的:Harness 本身就是 Dataset。

如果未来出现某种 Transaction Foundation Model,它需要的不会只是行情和成交数据,而是带有策略意图、风险边界、执行路径和结果标签的交易轨迹。这样的数据必须来自真实执行,也必须从第一天就按可复用 schema 设计。否则三年后回头看,可能只是堆了很多无法训练的日志。

这也是为什么 trading agent 的竞争,长期可能从 API competition 走向 execution data competition。

六、交易所的位置与 Bitget 的早期探索

在 trading agent 这个场景里,交易所处在一个很特殊的位置。

模型公司可以提供 reasoning,中间件公司可以提供 workflow,钱包可以提供签名和链上权限,云平台可以提供 runtime。但中心化交易所掌握的是另一组资产:托管账户、订单和成交数据、市场深度、风控系统、清算系统、权限体系和 7×24 运行基础设施。

这些资产让交易所具备构建 Trading Agent Harness 的结构性机会。它们离真实执行和真实结果最近,也最有可能沉淀高质量的 execution data。

当然,这并不意味着交易所天然会赢。交易所通常不擅长开发者生态,文档和 API 体验未必 agent-friendly,合规要求会让产品迭代更谨慎,用户对自动交易的信任也需要慢慢建立。更重要的是,交易数据的使用必须有严格的授权、匿名化、隐私和合规设计。

所以交易所如果要进入 agent 时代,不能只把 API 暴露出去。它需要完成一次更深的升级:从 execution backend 走向 trusted harness layer。

Bitget 是这个方向里的一个早期案例。Bitget Agent Hub 已经围绕 MCP、API、Skills、CLI 等模块展开,试图连接 AI models、developer tools 和真实交易执行,让开发者和 AI agents 可以访问市场数据、运行策略并执行交易。Bitget 也披露过 Agent Hub 覆盖多个能力模块和 58 个工具,包括现货、合约、跟单和理财等方向。

这说明 Bitget 已经走出了第一步:让交易所能力对 agent 更可见、更可调用。

但从行业角度看,这仍然只是早期阶段。工具暴露只是起点,真正的分水岭在后面。一个交易所能不能成为 Trading Agent Harness,要看它能否解决几个更深的问题:agent 能不能默认发现它,key 和签名边界是否清楚,权限是否足够精细,交易行为是否可追踪,结果是否可验证,失败是否能写回 guardrails,execution trace 是否能形成数据资产。

如果 Bitget 或其他交易所能继续向 trace、evaluation、guardrails、KYA 和 feedback loop 演进,交易所竞争可能会从流动性、产品深度和用户规模,进一步扩展到 agent-native trust 和 execution data。

这会是一个比「谁有更多 MCP 和 Skills」更重要的问题。

结语:下一代 AI 基础设施,就是 Agent Harness

Agent 时代的真正变化,不是 AI 会说得更好,而是 AI 开始做事。

一旦 AI 开始做事,基础设施就会被重写。它需要发现工具,获得权限,调用系统,完成支付,执行动作,接受审计,被评估,并从失败中改进。

这些能力加在一起,就是 Agent Harness。

从投资角度看,我们更关注那些能进入高价值工作流、持续沉淀 context、workflow、trace、evaluation 和 outcome data 的公司。它们未必一开始看起来最热,也未必有最漂亮的前端产品,但如果它们站在正确的位置上,可能会成为 agent 时代真正的基础设施。

Trading agent 只是其中一个案例。类似的逻辑也会在法律、医疗、安全、芯片设计、企业合规和金融工作流里发生。

未来的 AI 竞争,会经历三次迁移。

第一阶段,比谁的模型更强。

第二阶段,比谁能让 agent 更可靠地完成真实工作。

第三阶段,比谁能把每一次执行,沉淀成下一次更好执行的数据资产。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

Foresight News的精選文章

35 分鐘前
50 倍存储后,孙宇晨永远在看下一个十年
56 分鐘前
SUI 一周涨超 50%,原因不止价值超 1 亿美元代币被锁定
1 小時前
链上估值近 1.4 万亿,Anthropic 说这些交易全部无效
查看更多

目錄

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

相關文章

avatar
avatarOdaily星球日报
29 秒前
Anthropic和OpenAI,亲手斩断了盘前币股的逻辑
avatar
avatarPANews
17 分鐘前
Circle Q1业绩平平背后:利息收入遇瓶颈,Arc与 AI支付补位
avatar
avatarOdaily星球日报
28 分鐘前
涨了9倍的「VVV」概念,到底在讲什么故事?
avatar
avatarForesight News
35 分鐘前
50 倍存储后,孙宇晨永远在看下一个十年
avatar
avatar深潮TechFlow
51 分鐘前
买 AI 会员返贫的打工人
APP下載
Windows
Mac

X

Telegram

Facebook

Reddit

複製鏈接