人工智能现在在预测初创企业成功方面比风险投资公司更出色

CN
Decrypt
關注
4 小時前

GPT-4能否在2008年发现Airbnb——或在2012年发现Figma——比专业人士更早?

来自牛津大学和Vela Research的研究人员发布了一篇新论文,建议大型语言模型在挑选赢家方面已经优于大多数早期投资者。在这个以模式匹配和温暖介绍而闻名的领域,AI更早地发现有前途的创始人的前景——而不需要知道他们的名字——可能会改变游戏规则。

如果像GPT-4o这样的模型能够稍微提高命中率,那么它们可能会成为每个公司的交易来源工具中必不可少的工具,甚至可能使创业投资变得更加公平。

这篇研究论文“VCBench: 在风险投资中对大型语言模型进行基准测试,”介绍了VCBench,这是第一个开放基准,旨在测试AI是否能够在创业成功之前进行预测。研究团队构建了一个包含9000个匿名创始人档案的数据集,每个档案都与早期公司的数据配对。大约810个档案被标记为“成功”——定义为实现重大增长里程碑,如退出或IPO——为模型提供了稀疏但有意义的训练信号。

至关重要的是,研究人员清除了数据集中的姓名和直接标识符,以便模型无法简单地记住Crunchbase的琐事。他们甚至进行了对抗性测试,以确保大型语言模型不会通过公共数据重新识别创始人,从而将重新识别风险降低了92%,同时保留了预测特征。

在测试中,这些模型的表现优于大多数人类基准。论文指出,“市场指数”——本质上是所有早期风险投资赌注的基线表现——仅实现了1.9%的精度,即每50次尝试中只有一个赢家。Y Combinator的表现更好,达到3.2%,大约是市场的1.7倍,而一流风险投资公司则达到约5.6%,大约再翻倍。

然而,大型语言模型的表现远超这一基线。

例如,DeepSeek-V3的精度超过市场指数的六倍,而GPT-4o以最高的F0.5分数位居排行榜首,平衡了精度和召回率。Claude 3.5 Sonnet和Gemini 1.5 Pro也轻松超越市场,进入与顶级风险投资公司相同的表现层级。

换句话说,几乎每个测试过的前沿大型语言模型在识别可能的赢家方面都比平均风险投资者做得更好——而且几个模型的预测能力与Y Combinator和顶级基金相匹配或超过。

研究人员已将VCBench作为公共资源发布在vcbench.com,邀请社区运行自己的模型并发布结果。如果排行榜上充满了超越市场的大型语言模型,那么这可能会重塑早期投资的格局。一个由AI代理在LinkedIn上寻找创始人而不是冷邮件联系合伙人的世界可能并不遥远。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接