a16z:预测市场走向爆炸性增长的关键是什么?

CN
链捕手
關注
6 小時前

作者:a16z

编译:佳欢,ChainCatcher

去年,委内瑞拉总统大选结果的预测市场交易额超过了 600 万美元。但当计票结束时,市场面临着一个不可能的局面:政府宣布尼古拉斯·马杜罗获胜;而反对派和国际观察员则指控存在舞弊。预测市场的决议究竟应该遵循“官方信息”(马杜罗获胜),还是“可信报道的共识”(反对派获胜)?

在委内瑞拉选举一案中,观察员们的指控层层升级:他们先是谴责规则被无视、用户资金‘被窃’,进而痛斥该决议机制在这场政治博弈中独揽大权——集‘法官、陪审团和刽子手’于一身,甚至直言其遭到了严重操纵。

这并非孤立的小插曲。这是我认为预测市场在规模化过程中面临的最大瓶颈之一:合约裁定

这里的风险极高。如果裁定处理得当,人们就会信任你的市场,愿意在其中交易,价格也会成为对社会有意义的信号。如果裁定处理失当,交易就会让人感到沮丧和不可预测。参与者可能会流失,流动性面临枯竭的风险,价格也不再反映对稳定目标的准确预测。取而代之的是,价格开始反映出一种模糊的混合体——既包含结果发生的实际概率,也包含交易者对扭曲的决议机制将如何裁决的信念。

委内瑞拉的争议相对高调,但在各个平台上,更隐蔽的失败经常发生:

  • 乌克兰地图操纵案展示了对手如何直接通过博弈决议机制来获利。一份关于领土控制权的合约规定,它将根据特定的在线地图进行决议。据称有人修改了该地图以影响合约的结果。当你的“真理来源”可以被操纵时,你的市场也就能够被操纵。

  • 政府停摆合约展示了决议来源如何导致不准确或至少不可预测的结果。决议规则规定,市场将根据美国人事管理办公室网站显示停摆结束的时间进行赔付。特朗普总统在 11 月 12 日签署了拨款法案——但由于不明原因,OPM 的网站直到 11 月 13 日才更新。那些正确预测停摆将在 12 日结束的交易者,因为网站管理员的延迟而输掉了赌注。

  • 泽连斯基西装市场引发了关于利益冲突的担忧。该合约询问乌克兰总统泽连斯基是否会在特定活动中穿西装——这看似是一个微不足道的问题,却吸引了超过 2 亿美元的赌注。当泽连斯基穿着 BBC、《纽约邮报》和其他媒体描述为西装的服装出席北约峰会时,市场最初决议为“是”。但 UMA 代币持有者对结果提出异议,决议随后翻转为“否”。

在这篇文章中,我将探讨如何巧妙地结合大语言模型(LLMs)和加密技术,帮助我们创建一种难以操纵、准确、完全透明且具有可信中立性的预测市场大规模决议方式。

困扰不仅是在预测市场

类似的问题也一直困扰着金融市场。多年来,国际掉期与衍生工具协会(ISDA)一直在与信用违约互换(CDS)市场中的裁定难题进行博弈。所谓 CDS,即一种在公司或国家债务违约时进行赔付的合约。其 2024 年的审查报告对这些困难坦诚得令人瞩目。他们的决议委员会由主要市场参与者组成,投票决定是否发生了信用事件。但这一过程因不透明、潜在的利益冲突和不一致的结果而受到批评,就像 UMA 的流程一样。

根本问题是一样的:当巨额资金取决于对模棱两可情况的判定时,每一个决议机制都会成为被博弈的目标,每一个模糊点都会成为潜在的爆发点。

理想裁定方案的四大支柱

任何可行的解决方案都需要同时实现几个关键属性:

  1. 抗操纵性 如果对手能够影响裁定,比如通过编辑维基百科、植入假新闻、贿赂预言机或利用程序漏洞,市场就变成了一场比拼谁更会操纵的游戏,而不是谁更会预测。

  2. 合理的准确性 机制必须在大多数时候做出正确的裁定。在充满真实模糊性的世界里,完美的准确性是不可能的,但系统性错误或明显的失误会摧毁信誉。

  3. 事前透明度交易者需要在下注前确切了解决议将如何进行。中途改变规则违反了平台与参与者之间的基本契约。

  4. 可信的中立性参与者需要相信该机制不偏袒任何特定的交易者或结果。这就是为什么让持有大量 UMA 的人来决议他们已下注的合约是如此成问题:即使他们行事公正,利益冲突的表象也会破坏信任。

人工评审团可以满足其中一些属性,但在规模化时,他们很难做到其他几点——尤其是抗操纵性和可信的中立性。像 UMA 这样的基于代币的投票系统,在巨鲸主导和利益冲突方面也有其自身被充分记录的问题。

这就是 AI 以此为切入点的地方。

支持 LLM 法官的理由

这是在预测市场圈内获得关注的一个提议:使用大语言模型作为决议法官,并在合约创建时将特定的模型和提示词锁定在区块链上。

基本架构如下:在合约创建时,做市商不仅要用自然语言指定决议标准,还要指定确切的 LLM(由带时间戳的模型版本标识)以及用于确定结果的确切提示词(prompt)。

该规范被加密提交到区块链上。当交易开启时,参与者可以检查完整的决议机制,他们确切地知道哪个 AI 模型将裁决结果,它将接收什么提示词,以及它能够访问哪些信息源。

如果他们不喜欢这个设置,他们就不交易。

在裁定时间,已提交的 LLM 使用已提交的提示词运行,访问指定的信息源,并生成判决。输出结果决定谁获得赔付。

这种方法同时解决了几个关键约束:

  • 极强地抵抗操纵(虽非绝对) 与维基百科页面或小型新闻网站不同,你无法轻易编辑主流 LLM 的输出。模型的权重在提交时是固定的。要操纵决议,对手需要破坏模型依赖的信息源,或者在很久以前以某种方式毒害模型的训练数据,与贿赂预言机或编辑地图相比,这两种攻击方式成本高昂且不确定性大。

  • 提供准确性随着推理模型的迅速改进,并且能够处理惊人的一系列智力任务,特别是当它们能够浏览网络并寻找新信息时,LLM 法官应该能够准确地决议许多市场——了解其准确性的实验正在进行中。

  • 内置透明度在任何人下注之前,整个决议机制都是可见且可审计的。没有中途规则变更,没有自由裁量的判断,没有密室谈判。你确切地知道你签署的是什么。

  • 显著提高可信的中立性LLM 在结果中没有经济利益。它不能被贿赂。它不拥有 UMA 代币。它的偏见,无论是什么,都是模型本身的属性——而不是利益相关方做出的临时决定的属性。

AI 的局限性与防御手段

  • 模型会犯错 LLM 可能会误读新闻文章,产生事实幻觉,或不一致地采用决议标准。但只要交易者知道他们是用哪个模型下注,他们就可以将这些缺陷计入价格。如果特定模型有已知的倾向以特定方式解决模棱两可的案例,成熟的交易者会考虑到这一点。模型不需要完美;它需要是可预测的。

  • 并非不可能操纵如果提示词指定了特定的新闻来源,对手可能会试图在这些来源中植入故事。这种攻击对主流媒体来说很昂贵,但对较小的媒体来说可能是可行的——这是地图编辑问题的另一种形式。提示词的设计在这里至关重要:依赖多样化、冗余来源的决议机制比依赖单点故障的机制更稳健。

  • 中毒攻击在理论上是可能的拥有足够资源的对手可能会试图影响 LLM 的训练数据,以此来偏向其未来的判断。但这需要在合约之前很久就采取行动,且回报不确定,成本巨大——这比贿赂委员会成员的门槛要高得多。

  • LLM 法官的扩散会产生协调问题如果不同的市场创建者使用不同的提示词致力于不同的 LLM,流动性就会分散。交易者无法轻易比较合约或汇总跨市场的信息。标准化是有价值的——但让市场发现哪种 LLM 与提示词的组合效果最好也是有价值的。正确的答案可能是某种组合:允许实验发生,但建立机制让社区随着时间的推移收敛到经过充分测试的默认设置上。

给构建者的四条建议

总结来说:基于 AI 的裁定基本上是用一组问题(人类偏见、利益冲突、不透明)交换另一组问题(模型局限性、提示词工程挑战、信息源漏洞),而后一组问题可能更易于处理。那么我们该如何推进?平台应该:

  1. 实验: 在较低风险的合约上测试 LLM 决议,以建立过往记录。哪些模型表现最好?哪些提示词结构最稳健?在实践中会出现什么故障模式?

  2. 标准化: 随着最佳实践的出现,社区应致力于制定标准化的 LLM 与提示词组合,作为默认设置。这并不排除创新,但有助于流动性集中在被充分理解的市场中。

  3. 构建透明工具: 例如构建界面,使交易者在交易前容易检查完整的决议机制——模型、提示词、信息源。决议规则不应被埋没在细则中。

  4. 进行持续治理: 即使有了 AI 法官,人类仍需负责顶层规则的制定:信任哪些模型,如何处理模型给出明显错误答案的情况,何时更新默认设置。目标不是完全把人类从循环中移除,而是让人类从临时的逐案判断转向系统的规则制定。

预测市场拥有非凡的潜力,可以帮助我们理解一个嘈杂、复杂的世界。但这种潜力取决于信任,而信任取决于公平的合约决议。我们已经看到了决议机制失败的后果:困惑、愤怒和交易者离场。我曾目睹人们在感到被一个似乎违背其下注精神的结果欺骗后,愤而完全退出预测市场——发誓不再使用他们以前喜欢的平台。这对于解锁预测市场的利益和更广泛的应用来说,是一个错失的机会。

LLM 法官并不完美。但当它们与加密技术结合时,它们是透明的、中立的,并且能够抵抗那些一直困扰人类系统的操纵。在一个预测市场规模化速度超过我们治理机制的世界里,这可能正是我们所需要的。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接