018 年起,Web3“数据主权”逐渐觉醒。
彼时,“数据主权”(Data Sovereignty)强调用户对个人数据的拥有权和控制权,主张用户不是“数据的生产者”而是“数据的所有者”。
为此,Web3 构建了一系列技术,比如以去中心化身份(DID)、自我主权身份(SSI)、数据传输协议(IPFS)。
然而,随着 Web3 的演进,以 DeFi、GameFi、Staking 为代表的金融叙事兴起,“数据主权”逐渐沉寂。尽管如此,围绕数据进行的产品构建并未停滞,依然稳步向前。
纵观当前围绕数据搭建的热门领域,我们可以根据其落地乃至变现的路径,大致将其分为三大类:
当数据被生产,存储便成了第一个可变现的环节。
过去,你的数据被存放在各大平台的数据库中。虽表面“免费使用”,但实际的所有权与隐私权早已脱离用户掌控。因此,Web3 强调“付费存”,但通过去中心化技术,你可以完全掌握数据的保存权与分发权。
在此模式下,以 Filecoin、Arweave、Storj 等为代表的去中心化网络诞生,构建了抗审查、抗单点故障的数据存储基础设施。在这些系统中,用户可以通过提供存储空间、质押资源或上传数据内容的方式参与网络运行,换取 Token 激励。
不过,“存”解决的是数据的存续问题。在这一路径下,数据并没有体现其使用价值,用户仍处于“资源提供者”而非“价值创造者”的位置。
换言之,在“存”的叙事下,数据的价值逻辑依然是技术性,而非经济性。
如果“存”处理的是数据的归属与存续问题,那么“析”则试图从数据中挖掘解释能力,进而创造洞察价值。
作为强金融属性的 Web3,用户最多、需求最旺盛的也当然是市场数据分析和项目数据分析。以 Dune、DefilLama、Nansen 为代表的数据分析平台,以及以 Chainlink、Pyth Network 为代表的预言机等项目诞生,并成为 Web3 最为关键的基础设施之一。
不过,在这一路径中,用户的数据并非以“资产”的形式参与市场流通,而是以“原材料”的身份,被平台统一提取、加工、重组,最终形成可供调用的图表、指数、预言信息或情报包。平台是解释者,也是变现者;而用户,更多只是可被分析的对象,或偶尔能贡献内容的辅助节点。
即使像 Dune 这样的平台允许用户自由创建 Dashboard,或 Nansen 提供钱包行为标签服务,这些功能在赋能分析者的同时,并未实质改变数据解释权、所有权与收益权的结构性分配。
简单来讲,在“析”中,用户同样是数据贡献者,并没有享受到数据价值的变现。
2021 年后,随着技术的发展与成熟,“数据资产化”的叙事开始成型,并逐步走向台前。
这一路径尝试解决的核心问题便是:用户在完全拥有控制权之余,是否能够发挥数据的最大价值,比如通过数据分享,获得可追踪可衡量的回报?
围绕这一目标,Web3 数据行业开始了不同的展开:
在当前的数据资产化热潮中,最受关注的毫无疑问是 InfoFi。
从 2023 年下半年开始,以 Kaito AI、Cookie.fun 为代表的 InfoFi 项目相继完成多轮融资,前者累计募资超过千万美金,投资方囊括 Dragonfly、红杉中国、Jane Street 等老牌机构;后者也在种子轮获得 20 余家机构的支持,成为社交型数据资产平台的新范式。
在 InfoFi 的叙事中,社交媒体的信息也是一种数据资产。
在过去的互联网中,用户在社媒上发布的每一条内容、观点、评论、标签,都会被这些平台收集,并用于大数据模型建设、AI 训练、情报聚合,乃至分享或者销售给其他三方平台,实现商业变现。
比如,2024 年 5 月,OpenAI 与 Reddit 达成了一项数据授权协议,允许 OpenAI 访问 Reddit 的 Data API,从而将 Reddit 的内容引入 ChatGPT 和其他产品。
而这,正说明了用户在社媒发布的都是“有价值的信息单元”。因此,InfoFi 构建了 Web3 用户数据变现的模式:
用户通过发布观点、参与讨论、打上标签等方式,生成结构化的信息内容,并贡献给 InfoFi 平台。这些内容一旦被系统识别为“高质量”,便会被纳入信息集合中,用于下游应用,比如 AI 训练、市场研究、行业画像等。InfoFi 平台则通过“标签信誉”“专家打赏”“订阅系统”等机制,给予贡献者一定的声誉积分或 Token 激励。
在这种机制之下,用户不再是免费贡献内容的工具人,而是成为信息资产的共同建设者与受益方。
不过,InfoFi 的限制也比较明显。因为用户贡献的“数据”更多是文本、观点、内容标签等“信息型数据”,而非行为、轨迹、消费等“行为型数据”,这就导致其资产化能力只能集中在某些特定场景和内容上,难以覆盖多元化的现实数据维度。
另外,平台机制仍保有部分中心化特征,比如内容审核、标签分发、激励配置等核心流程高度依赖平台本身,虽然引入社区审核或内容推荐系统,但整体上,用户在实际收益权与解释权方面仍处于被动地位。
也因此,当我们试图推进“数据资产化”的叙事时,InfoFi 只能算是“补上了信息资产的一角”,尚不足以建立一个通用的、可扩展的用户数据价值闭环。
这,便是 DataFi 叙事切入的真正起点。
在传统的数据交易中,真正具有价值,可以资产化的,往往是用户行为。
广告主不需要知道你写了什么评论,他们关心的是你点了什么链接、买了什么商品、花了多少时间、跳过了哪个视频;AI 模型训练者也不在乎你在帖子里表达了什么,而是你看了什么内容、如何滑动屏幕、在什么时机停留。
这些数据之所以具备资产价值,并不在于它们稀缺或隐私,而在于它们具有可匹配、可建模、可嵌套进商业系统的结构特征。
比如你在凌晨浏览保健品、跳过奢侈品广告、反复查看价格较低的运动鞋,这一系列微小行为,组合在一起就构成了一个可识别的行为链条。对于品牌来说,它不仅是一个“人”的轮廓,更是一个“人群”的入口。一旦验证这个标签组合足够稳定,就可以在数据库中批量识别相似人群,进行定向投放或产品推荐,进而提升广告效率和 ROI。
也因此,DataFi 围绕此类数据,提出了与 InfoFi 截然不同的叙事逻辑:
一方面,用户不再只是平台的数据来源,而是真正拥有数据资产的所有者和授权方。你不需要特意生产内容,也不必关心如何获得关注,只需要像往常一样浏览、点击、购买、参与活动,并在 DataFi 平台授权数据调用,这些行为就会被转化为结构化的标签,成为你能掌控的数据资产。
另一方面,这些数据资产也带来了更直接、明确的变现路径。当品牌或机构希望调用某类数据时,它们必须明确请求授权并支付费用(由数据包持有者定价),在同意后方可使用。相对应的,无论是数据持有者还是贡献者,都可以在这次的交易中获得对应的收益。而由于这些数据是以标准化、可验证的形式存在的,它们不仅能够重复调用,还可以在不同场景下持续产生收益。
更重要的是,DataFi 通过零知识证明(ZK)、多方安全计算(MPC)等隐私保护技术,让数据使用的全过程透明而隐私安全。你的数据以“标签包”或“数据资产包”的形式加密封装,品牌无法直接查看具体的个人信息,只能获得经你授权的、匿名的行为特征组合。而你,却能随时知道数据被用在哪、收益如何产生,也能随时撤回权限,真正实现了用户对数据资产的完整掌控和隐私保护。
而这,才是真正的“数据资产化”:
从用户行为出发,到用户收益回归,完成一个清晰、持续、可控的数据资产闭环。
InfoFi 拉开了数据资产化叙事的序幕,而 DataFi 真正触及数据价值的内核与闭环:从数据的结构化表达,到用户对资产的明确持有;从链上清晰透明的授权与调用机制,到反复流通、持续收益的完整资产周期。DataFi 所定义的,不仅是“数据资产”,更是“数据如何成为资产”。
当 DataFi 真正落地并进入大规模应用时,用户不再仅是数据的贡献者,而是资产的真正所有者;企业与品牌也将不再局限于传统的信息流变现,而能获得更精准、更稳定、更可持续的数据调用路径。
从这个意义上来看,InfoFi 或许只是 Web3 数据资产时代的序幕,而 DataFi,才真正打开了数据资产时代的大门。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。