a16z领投3300万美元种子轮,Yupp如何基于区块链与激励重塑AI评估模式?

CN
10 小時前
原文标题:《a16z 领投 3300 万美元种子轮,Yupp 如何基于区块链与激励重塑 AI 评估模式?》
原文作者:ShenZhen,PANews

随着 AI 应用深入各行各业,如何准确评估模型性能与提升用户信任成了当下亟待解决的难题。传统评测多依赖集中化机制,既难以覆盖多样化场景,也无法反映真实用户偏好;与此同时,模型「幻觉」问题频出,用户在选择时常陷入信息茧房。

在这一背景下,Yupp 作为一家新晋平台,凭借其独特的众包模式和激励机制,正试图重塑 AI 模型的发现、比较与使用方式,并为 AI 评估领域带来一场范式变革。本文将深入剖析 Yupp 的核心机制、技术亮点、团队背景及其对 AI 生态的潜在影响。

团队背景与融资:科技巨头经验加持

Yupp 立足于解决 AI 领域长期存在的评估难题,致力于构建一个「去信任」(trustless)的 AI 反馈市场——让多元化的用户反馈在区块链和加密经济激励的保障下自由流通,从而形成一个可扩展、公平且透明的模型评估层。通过对高质量人工标注数据的激励分发,Yupp 可以及时捕捉真实用户在不同场景下的需求和偏好,帮助 AI 开发者以迭代的方式优化模型性能。

该项目由 Pankaj Gupta(联合创始人兼 CEO)和 Gilad Mishne(联合创始人兼 AI 负责人)于 2024 年 6 月创立,首席科学家 Jimmy Lin(滑铁卢大学教授)亦参与核心团队。三人早在 2010 年于 Twitter 共事,曾打造并优化大规模推荐与搜索系统,后在 Google 和 Coinbase 积累了丰富经验。

因去中心化、数据价值透明化的愿景能够切中 AI 厂商对可信评估和用户参与的双重诉求,以及得益于核心团队的丰富履历,Yupp 赢得了科技行业知名人士和顶级风投的高度认可。

上周,Yupp 宣布完成 3300 万美元种子轮融资,A16z 合伙人 Chris Dixon 领投,其他投资方还包括 Google 首席科学家 Jeff Dean、Twitter 联合创始人 Biz Stone、Pinterest 联合创始人 Evan Sharp、Perplexity CEO Aravind Srinivas、斯坦福大学 Dan Boneh、Chris Re、Nick McKeown 和 Balaji Prabhakar 等 45 位知名天使及企业高管,以及 Coinbase Ventures。

核心功能与用户体验:构建「AI 议会」

作为一个中心化的 AI 评估平台,Yupp 秉持「人人共享的 AI(Every AI for everyone)」理念,让用户轻松发现、比较并使用最新的 AI 模型。与传统单一响应不同,Yupp 针对每个提示同时返回两个(乃至更多)模型的答案,形成一个「AI 议会」。这种设计不仅满足了用户对多样化选择的需求,更能有效甄别模型可能出现的「幻觉」,帮助用户通过对比做出更明智的决策。正如 Yupp CEO Pankaj Gupta 所言,并排输出对于关注生成错误的用户尤为有益,因为他们可以借此交叉验证结果。

平台现已支持逾 500 款 AI 模型,涵盖文本与图像生成领域,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等知名模型,以及众多新兴模型。为进一步优化体验,Yupp 还推出了「QuickTake」功能,可将冗长回复提炼为一条简洁的推文。

此外,Yupp 高度重视用户隐私:所有聊天记录默认私密,除非用户主动公开;即使公开分享,也不透漏任何个人信息。用户可随时控制分享内容及范围。

经济模型与激励机制:数据劳动价值化

Yupp 将免费使用与用户反馈结合,通过「Yupp 积分」系统衡量模型使用情况。新用户注册秒获 5000 积分,后续可通过对模型回复打分、选择偏好并阐述理由来赚取更多积分。反馈质量越高,奖励越丰厚,确保用户可持续免费使用包括 Claude Opus 4 或 OpenAI o3 等高端模型。平台承诺,积分只增不减,且当前所有模型皆能免费体验。

在每次提问后,用户会获得两份模型回答,并通过反馈赢取「数字刮刮卡」,奖励 0~250 不等的 Yupp 积分。每 1000 积分可兑换 1 美元,用户每日最高可提现 10 美元、月度最高 50 美元。积分支持兑换美元、欧元等 20 余种货币,合作伙伴包括 Stripe、PayPal、Coinbase。同时,平台集成了 Base Ethernet L2 和 Solana 稳定币,为全球用户提供即时、免手续费的奖励。

正如 Pankaj Gupta 所说,用户产生的高质量反馈对于 AI 公司的模型微调与强化学习价值远超奖励本身。虽然用户月度收益或仅相当于几杯咖啡,但这些付费标注数据对 AI 迭代至关重要。

为激励更多人参与,Yupp 还设立推荐奖励:推荐人获 5000 积分,被推荐人获 1000 积分;目前新注册用户可获 5000 积分,被推荐人额外获得 2500 积分。

Yupp VIBE 评分:AI 评估的新范式

针对现有排行榜透明度不足、公平性欠缺、评估数据获取不均等问题,Yupp 推出了测试版 AI 排行榜和「Yupp VIBE (Vibe Intelligence Benchmark) Score」评分系统。该系统汇聚全球用户在自然交互中产生的偏好数据,力求提供稳健且可信赖的评估结果。

Yupp 的评估原则包括:

· 稳健性(Robust):保证代表性(覆盖多样场景)、真实性(反映用户关切)、抗作弊性(抵御恶意行为);

· 可信赖性(Trustworthy):公平中立(对模型不偏不倚)、透明公开(详细披露排名算法)、严谨科学(遵循评估规范)。

平台不仅收集二元偏好,还鼓励用户指出回复的优缺点(如「切中要害」、「速度快」、「风格佳」等),并根据用户的年龄、教育、职业等信息进行分群分析,展现不同群体的偏好差异。

在技术层面,Yupp 正在探索利用区块链、密码学原语及零知识证明等技术,确保评估过程的公正、透明和可验证。同时,平台已与专业 AI 数据提供商合作,通过档案验证和多层质量检测校准评分员,清除恶意数据。

近期榜单已更新,展示了 GPT‑4.5 Preview、Claude Opus 4、Claude Sonnet 4 等模型的 VIBE 得分及其胜率、不喜欢率、速度、延迟、上下文窗口和成本指标。

发展历程与未来展望

Yupp 于 2025 年 6 月 13 日正式上线,前期进行了六个月内部测试。自上线以来,产品持续迭代:

· 多模态支持:接入 Dall‑E、Flux、Stable Diffusion、Luma Photon、Google Imagen 4 等模型,并支持用户上传图像/PDF 提问;

· 交互方式拓展:新增语音输入与语音朗读功能;

· 模型更新:陆续引入 DeepSeek R1/V3、Mistral Small 3、OpenAI o3‑pro、Hermes 3、Amazon Nova Pro v1、Microsoft Phi 系列及「MAX 模型」类别;

· 实时信息:将在线查询请求路由至 Perplexity 和 Google Gemini Live,并附带超链接引文;

· 支付升级:新增美国 PayPal、Venmo 提现及 24 种货币 PayPal 支持;

· 分享导出:支持格式保留的复制、PDF/文本/Markdown 导出,按需分享单条回复或整段对话;

· 社区活动:举办「AI 提示挑战赛」等活动,奖品最高达数万积分;新增个人资料页、AI 自动生成的聊天名称等功能。

Yupp 的使命是「赋能人类塑造 AI 的未来」。Pankaj Gupta 认为,AI 发展需要每个人的参与与贡献。通过多视角 AI 回应和用户反馈,Yupp 不仅助力用户更好决策,也为 AI 进化提供源源不断的动力。

值得一提的是,Yupp 的主要竞争对手之一是开放 AI 模型评测平台 LMArena(网址:https://lmarena.ai/),该网站在 AI 业内人士中非常受欢迎,但该平台目前正处于商业化探索阶段,并没有借用区块链技术对用户参与提供直接的物质奖励或积分激励机制。

总的来说,Yupp 以众包模式、激励机制与真实用户偏好驱动的评估系统,开辟了 AI 评估的新路径。它不仅为用户提供免费、多样的 AI 互动体验,更将用户反馈转化为高价值训练数据,推动模型持续优化。凭借经验丰富的团队和顶级资本加持,Yupp 有望在未来 AI 生态中扮演关键角色,实现「人人皆享 AI,人人塑造 AI」的愿景。

然而,对于刚刚上线的 Yupp 而言,如何在大规模用户参与下,持续确保数据质量、抵御潜在的作弊行为,以及在商业化与用户激励之间取得平衡,仍将是其未来发展中需要不断探索和优化的方向。

原文链接

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

ad
Gate: 注册赢取$10000+礼包
廣告
分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接