a16z crypto 领投,谷歌首席科学家 Jeff Dean、X 联合创始人 Biz Stone 参投,Yupp 如何用众包模式撕开 AI 普惠和评估的突破口?
撰文:KarenZ,Foresight News
随着 AI 技术的飞速发展,AI 模型的层出不穷和多样化让用户眼花缭乱。如何选择适合自己的 AI 模型,除传统基准测试外如何让模型精准捕捉真实需求、如何为反馈用户提供实打实的激励,成为 AI 行业亟待突破的关键命题。
Yupp 正是在这一背景下诞生的开放型平台,旨在建立一个开放、透明、社区驱动的 AI 模型评估平台。正如 Yupp 所说,「与历史上任何其他技术创新相比,AI 更依赖于每个人的参与和贡献来推动进化。」
上周(6 月 13 日),Yupp.ai 宣布了 a16z crypto 领投的 3300 万美元种子轮融资,同时谷歌首席科学家 Jeff Dean、X 联合创始人 Biz Stone 等豪华投资人阵营吸引了社区的目光。与此同时,Yupp 还推出了其产品,不仅为用户提供了一个探索 AI 的窗口,更通过社区参与和区块链技术重新定义了 AI 模型的评估与优化方式。
Yupp 背后公司为 Ber Sarai Labs Inc.,由 Pankaj Gupta 和 Gilad Mishne 两位联合创始人于 2024 年 6 月共同创立,在过去 6 个月一直在秘密进行测试。Yupp 两位联合创始人和首席科学家于 2010 年在推特相识,均拥有深厚的 AI 行业背景,曾在 Coinbase、Google、X 等公司工作过。
本月 Yupp 官宣的 3300 万种子轮融资已于去年完成。Yupp 资本矩阵覆盖技术、投资与学术领域,除了领投方 a16z crypto 之外,谷歌首席科学家 Jeff Dean、X 联合创始人 Biz Stone、Pinterest 联合创始人 Evan Sharp、 Perplexity 首席执行官 Aravind Srinivas 、 Cred 首席执行官 Kunal Shah、斯坦福大学的四位教授(Dan Boneh、Chris Re、Nick McKeown、Balaji Prabhakar)、Othman Laraki、Paul Grewal、Gokul Rajaram 和 Coinbase Ventures 亦参与其中。
Yupp 定位为 AI 模型探索和评估平台,允许用户免费体验和比较各种 AI 模型,其核心理念是通过众包的方式进行模型评估:用户提交提示词,对比不同 AI 模型生成的回复,并给出较优答案和给出评定反馈,同时得到可兑现的积分激励。这些选择和反馈会被记录下来,形成用于 AI 模型后期训练和评估的数据。
Yupp 还将利用区块链等开放访问和无需许可的技术、零知识证明和挑战 / 响应机制等密码学原语和协议,以及机密计算等隐私保护技术,构建具有可证明的可信中立性、公平性和稳健性的系统。
Yupp 的运作机制可以概括为以下几点:
1、模型探索和对比:Yupp 汇集了超 500 个 AI 模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。用户可以在平台聊天页面找到各种 AI 模型,并进行 Prompt 测试,直观并排比较它们的优劣。
Yupp 当前有聊天页面和排行榜两个页面,其中,聊天页面设计较为简单,有消息框、文件上传功能、模型选择功能(可选)、图片上传功能、聊天私密和公开模式切换(默认私密)。
如下图所示,提问过后,Yupp 会给出两个 AI 的回答版本,然后用户选出较优版本。
值得一提的是,提问时模型默认自动选择,有时还会隐藏掉模型名称以收集更客观的反馈,当然,用户也可以随机提问。此外,Yupp 的 QuickTake AI 功能还可以提供简短总结回复。
2、用户反馈:用户在选出较优答案后,可以进一步通过点击标签反馈答案的优劣偏好,也可以用文字自由阐述。这些反馈将帮助用户定制未来在 Yupp 上的 AI 答案,也让 Yupp 能够免费提供模型。
3、反馈奖励:给出反馈后,用户会得到一个积分刮刮卡。积分可用于提问或兑现。
4、评估:用户通过选择的最佳回复和提供的反馈,参与到模型的评估过程中。Yupp 旨在建立一个公开透明的评估体系,让 AI 开发者可以获取有价值的训练数据,用户可以获得奖励,共同推动 AI 技术的发展。Yupp 平台具有一个名为「Yupp VIBE Score」(VIBE,Vibe Intelligence BEnchmark)的公开排行榜,旨在利用用户反馈来改进模型性能,同时保证用户 Prompt 的私密性,除非用户选择共享。
Yupp 会根据用户反馈以及响应速度等因素制定一个排行榜。排行榜中,可以按过滤器对平台上集成的 AI 模型进行排序,维度包括 VIBE 评分、概率样本的置信区间、投票情况、速度、延迟、输入 / 输出成本。
Yupp 的 AI 模型评估会结合用户的偏好数据,以更细粒度的方式对用户和评估数据进行细分,从而为 AI 开发者提供样本。Yupp 表示,凭借团队创始人在 Twitter 上应对垃圾信息和机器人问题的经验,开发了复杂的算法来剔除低质量数据,确保排名的完整性。Yupp 还组建了专门的信任与安全团队,并将继续在该领域投入大量资金。
Yupp 积分靠提问消耗、靠反馈赚取,并且部分可以兑现。Yupp 表示,如果用户负责任地使用 Yupp,将始终拥有足够的积分提问 AI 模型,并且还可以兑现一部分积分,以表示对改善生态系统状况的感激。
提问需要花费积分,初始注册后可免费获得 5000 积分。另外,总费用为默认费用、PRO 模型费用、附件提交费用、预选图片模型费用之和。
此外,Yupp 问答默认私密,如果用户选择公开问答,仅需支付上述常规费用的一半。
如前所述,反馈模型可以赚取积分刮刮卡。笔者得到的几个积分刮刮卡在 200 到 500 积分之间。
Yupp 表示,用户可以将积分提现,换成美元、欧元、印度卢比及其他 20 多种货币,或兑换成稳定币(基于 Base 和 Solana)。Yupp 还与 Stripe、Paypal 和 Coinbase 等支付服务提供商建立了合作关系,以满足用户的不同需求。每 1000 积分可以兑换 1 美元。不过兑现功能目前不可用。为了规避女巫或滥用行为,Yupp 还设定了积分兑现规则:
另外,Yupp 规定,购买、出售、交易或转让 Yupp 积分等此类交易违反服务条款,均视为无效,并可能导致账户立即停用。滥用可能会导致产品功能被禁用,甚至暂停账户。
Yupp 参与流程如下:
正如 a16z crypto 创始人和执行合伙人 Chris Dixon 表示,「Yupp 的设计将人类的判断转化为可持续的经济资源。随着新的互动替代旧的数据,数据「过期」,形成了一个自然的良性循环:更多的使用带来更新的评估;更新的评估产生更好的模型;更好的模型吸引更多的使用。所有参与者——从用户到 AI 模型构建者——都可以参与其中,并看到相同的透明规则适用于每个人,确保了一个可信的中立市场。没有人可以隐藏排行榜,也没有人可以操纵奖励或结果。」
Yupp 的口号「Every AI for everyone」,笔者认为译为「普惠 AI」更为贴切。Yupp 试图通过区块链技术与众包模式,构建 AI 时代的「评估基础设施」:让用户通过反馈获得激励,让开发者获取真实数据,最终推动 AI 技术向更普惠、更可信的方向进化。
参考:
https://www.wired.com/story/yupp-chatbot-pays-users-ai-model-feedback/
https://yupp.ai/help
https://blog.yupp.ai/launch
https://blog.yupp.ai/leaderboard
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。