ERC-8004 & Codatta:通往知识层的三条路
2025-12-15 05:43
Codatta
2025-12-15 05:43
Codatta
2025-12-15 05:43
订阅此专栏
收藏此文章
本文详细介绍了 ERC-8004 与 Codatta 的结合与应用,并提出了 3 种可能的结合方式:重构、融合与上下游。


撰文:Jason,VP of Engineering at Codatta


在之前的文章中,专门为 ERC-8004 提案做过一次完整的拆解,主要阐述了它的愿景,作用和实现原理。


详见:ERC-8004:以太坊上的 MCP


拆解的目的当然不是因为闲得无聊,很明显,作为一名行业非著名工具人,持续关注 AI 和 Web3 交叉的热点,紧跟行业发展趋势是必备的技能;此外,研究协议的可行性和可用性,也是极为重要的事情,倘若一不小心真的和实际应用场景擦出火花,形成有机地结合,那就真是赚大发了。


毕竟早已躬身入局,处在 AI 和 Web3 风云际会的十字路口,只有进来了才知道,在这个前沿赛道上,落后一年和落后十年没啥本质区别。


丛林法则中,时刻都是危机感啊!


于是下功夫研究了一圈,发现可结合点还真是有一些,果然通往技术巅峰的道路都是相似的。


为了避免大家的困惑,在具体讲结合点之前,有必要首先介绍一下出场双方的阵容,关于 ERC-8004,已经隆重介绍过了,这里就详细介绍一下另外一位出场选手——Codatta,也就是当前在致力于构建的一个关于 AI 知识层(Knowledge Layer)的解决方案。


什么是 Knowledge Layer?


老规矩,先放上官方介绍。


Press enter or click to view image in full size



一句话直白总结,就是为 AI 的训练提供高质量的数据。


为什么要为 AI 的训练提供数据呢?因为这个世代,AI 的进化逻辑已经和早些年完全不一样了,早些年是人类直接教 AI 规则,比如红灯停,绿灯行,一开始呢,上手快,效果好,确实是不错的。


后来呢,随着人类的野心越来越大,希望 AI 做的事情越来越多,于是呢,应用场景越来越复杂,规则越来越精细,甚至很多根本就难以描述。


比如 “见人说人话见鬼说鬼话“ 这种职场必备对话技巧,也就是在人类世界往往被称作情商的东西,别说 AI 了,很多人一辈子都学不会,你说怎么教?


于是呢,人类开始改变方法,就是我不教你具体规则了,你自己悟,我给你一堆数据,你自己学,比如让你看交通视频:到红灯的时候,所有车都停下来了,变绿灯的时候大家又都开动了,然后呢,有人头铁非要闯红灯,结果被扣分罚款了。


慢慢的慢慢的,这些视频你看多了以后,尽管你没考过科目 1,你大概也明白了红灯要等,绿灯可以通行这么个道理了。


所谓熟读唐诗三百首,不会作诗也会吟,就是这么个意思。


对这些数据的基本要求,首先就是要多,其次呢,是正确,最后呢,是易读。这些要求好理解吧,毕竟人类的学习教材大致上也是这样的,只不过人类教材的多和 AI 数据的多,完全不是一个量级的东西。


这些数据从哪来呢,一方面是通过真人来提供,另外一方面 AI 也可以自己生成,即所谓的合成数据(synthetic data)。当然,即便是真人提交,很多时候也可以引入 AI 来做预标注 (pre-labelling) 和辅助校验 (assisted validation),大量繁杂重复的流程交给 AI 效劳,人类基于 AI 的成果再做深度加工,实属居家旅行,降本增效的必备神器。


听起来很容易,实际上一点都不简单。


主要还是因为卷啊,想想看吧,丧心病狂的人类可不只是满足于仅仅让 AI 识别下红绿灯,他们希望 AI 能够帮忙多语言翻译,写研报,敲代码,还要会推理能解数学题,如果能证明哥德巴赫猜想就更好了。


你听听,他们自己都做不到的事情,现在不卷孩子了,卷 AI 了。


不知道这是孩子们的幸运还是不幸。


以上种种骇人听闻的要求,不光对数据量提出了要求,对数据质量也提出了相当高的要求。


这不是随随便便拍张照片的事情,拍张照片你不还得花时间修图呢,很多时候,需要投入大量的时间和精力去生产一份合格的数据,我们把这样的数据称之为知识(Knowledge)。


你要让 AI 学会写代码,你不得先给它示范怎么写代码啊?要是你给它的代码总是又臭又长,还编译不通过,你指望它能学成个什么玩意?


如果你不幸经历过三年高考,五年模拟的折磨,那么你应该能明白这种刷题的痛苦。


刷题固然痛苦,可是不断出题给你们刷,要让你们刷的有新鲜感,刷的有成就感,最好还能押中题,这也是很痛苦的事情啊啊。


别急,这还没完,这又牵扯出一个问题,当我花了那么多时间和精力,为 AI 提供了一份又一份高质量的数据以后,我能得到什么?


AI 变得越来越聪明,越来越能干以后,它做的第一件事情可能就是替代我,它学会了我所有的招式,然后取代了我。


教会徒弟,饿死师傅的人类经典剧本终究还是躲不开,人间不值得啊。


还好,办法总比问题多,Codatta 要做的,就是帮忙搞定这些问题,为 AI 提供大量高质量数据的同时,妥善照顾好数据提供者的情绪,不广照顾好情绪,还要安排妥当他们的利益。


具体怎么搞定这些问题的,限于篇幅,这里就不详细展开,有机会我们单独开一篇来讲解。关于今天的主题——可不可以和 ERC-8004 相结合,产生 1+1 大于 2 的效果,以及怎么结合——大家暂时只需要了解到 Codatta 具体是做什么的就够了。


那么,在开展接下来的畅想之前,我们先对两位选手做一个总结:


ERC-8004:一个 Agent 的“Boss 直聘”,Agent 们在这里挂简历,老板们根据简历找到心仪的 Agent,支付报酬并雇佣它为自己打工。


Codatta:一个知识生产平台,组织人类或者 Agent 来对数据进行生产加工,形成最终的产品 — — 数据资产,生产加工方式包括但不限于:

—— Sample:提交数据样本,比如一段十字路口的视频
—— Label:对数据进行标注,比如视频中有什么,哪些是人,哪些是车,哪一帧到哪一帧是红灯,哪一帧有车辆闯红灯,这个行为是错误的,甚至还可以标注上都有哪些型号的车。
标注是很考验人水平的了,尽管都是标注,不同人标注的信息,先不说对错,层次可能都完全不一样,标注这是一辆车,和标注出来这是一辆 2012 款的保时捷 911,差别可大着呢。
这还只是看图识物,要是上升到代码和数学的维度,那不同的标注差距可就更大了。
—— Validation:对提交和标注的数据进行校验,检查有无错误的地方,指出错误,甚至更进一步更正错误,给出正确答案。
不光搞生产,销售也帮忙包了。考虑到社会的不容易,Codatta 后续还会贴心地提供数据资产的交易和租赁市场,帮助数据资产的所有者产生收益,真正的一条龙服务。


看到这里,相信大家应该对于情况也有了基本的了解了,于是,紧接着,充分考虑了上述两位选手各自的特点后,我尝试分别在不同的层面,按照从深到浅的耦合程度,为它们策划了 3 种结合方式,为了方便描述,后面不妨分别称之为

👉 重构

👉 融合

👉 上下游


重构


重构,即用 ERC-8004 标准重构 Codatta DID,在 EVM 生态中以 ERC-8004 的形式来记录 Codatta DID。


忘了介绍,Codatta DID 是 Codatta 的去中心化数字身份系统,记录了 Codatta 用户的身份信息,换句话说,也就是 Codatta 用户的简历。


ERC-8004 虽然定位是一个为 Trustless Agent 服务的协议,但是实际上,由于协议本身的开放性和扩展性比较强(约束没那么多,规矩没那么死),所以,通过对很多字段的自定义使用,也能够适用于其它的应用场景。


就像 NFT 的 ERC-721 协议标准,最早诞生于一款叫做加密猫的游戏,后面格局打开了以后,发现简直是无所不能,除了游戏,还可以代表 PFP(Profile Picture NFT),IP,身份证 / 会员卡,现在甚嚣尘上的 RWA 也概莫能外。


在之前关于 ERC-8004 拆解的文章中讲到过,ERC-8004 本身作用之一就是承载和管理 AI Agent 的简历信息。


只是,尽管 ERC-8004 的一言一行都在力挺 Agent,在执行层面,却没有任何实际的限制,毕竟,就算限制了,也没法强制执行不是。


最关键的是,谁知道你的 Agent 背后,到底是代码执行,还是人在回路。


所以,你把 AI Agent 换成其它任意的主体,它其实也一样适用。


本质上,ERC-8004 是一个数字身份系统的标准,考虑到描述身份很多时候就是那么些套路(不信大家看看简历模版,无论怎么花式排版,基本的要素大多都是一样的),其实标准中的很多字段都是可以兼容的。


既然大家都是系出同源,那么,理论上,相互兼容也是可行的了。


因此,在 EVM 体系中,我们可以在 ERC-8004 的基础上来构建 Codatta DID,在保证基础功能的前提下,提升 Codatta DID 在 EVM 体系的易用性和普适性。


融合


融合,即 ERC-8004 标准和 Codatta DID 融合补充,相互提升信息完整性和真实性。


前面讲到过,Codatta DID 是 Codatta 的身份系统,主要视角和出发点是数据侧,关注的是用户在数据侧的贡献,记录的是谁,以什么方式贡献了什么数据(Sample,label,validation),贡献的质量如何(Reputation)。


其实,这个用户并不一定需要是真人,也可以是 AI 本身。


事实上,随着 AI 对数据的需求越来越高,无论是规模上,更新速度上,还是多样性上,仅仅依靠人工生产来为 AI 提供数据已经越来越跟不上节奏了,而通过 AI 生成模型来生产合成数据,用来替代或补充真实世界数据已经逐渐走向常规。


因此,在未来,这方面的 AI Agent 作为用户参与到 Codatta 的业务流程中来,是可以预见的事情。


届时,这些 Agent 将双重身份,从形式上来说,它可以是符合 ERC-8004 标准的 Agent,从业务上来说,它又是参与 Codatta 数据贡献的用户。


对于 Codatta DID 而言,兼容 ERC-8004 意味着能够无缝接入以太坊,或者更进一步说,接入整个 EVM 生态体系。这不仅显著提升了 Codatta DID 的生态覆盖面,也有助于推动其在更多应用场景中的普及与落地。


反过来看,对于 ERC-8004 而言,Codatta DID 所提供的身份信息源自 Codatta 平台长期业务运营中的真实沉淀,具备更高的真实性与完整性。这些高质量的身份数据注入 ERC-8004 生态后,将有效促进该标准的广泛采用与生态扩张。


上下游


上下游,即 Codatta 作为 ERC-8004 Agent 的上游供应侧,ERC-8004 作为 Codatta 的下游消费侧,实现 Royalty Engine 完整的,精细的闭环。


这里还得先补充一下背景知识,Royalty Engine 是 Codatta 构建的核心商业模式。


简单来说,就是用户通过提供有效地数据贡献(Sample,label,validation),可以从数据需求方处获得一次性的报酬,也可以按照贡献度获得数据的相应比例的所有权。


拥有数据的所有权,可以从后续数据的使用收益中获得持续性的分红收益,此外,由于不需要前期一次性支付高昂的数据采购成本,Royalty Engine 也有助于帮助数据需求方降低构建自身业务体系的前置成本。


Royalty Engine 事实上将数据贡献者和早期数据需求方之间由传统的甲乙方关系转变为了共创关系,这也是 Royalty Engine 的核心价值。


但是,Royalty Engine 要想能够理想运转,有两个重要的前提:


  1. 数据贡献的记录清晰、完整、准确
  2. 数据应用的记录清晰、完整、准确


所谓数据贡献的记录清晰、完整、准确,是指数据从诞生到加工到定型的全流程都能够被有效地记录,有效的标准就是清晰、完整、准确,只有这样,关于数据所有权的评定和分配才能够做到公平公正公开。


所谓数据应用的记录清晰、完整、准确,是指所有数据被使用的情况都能够被有效地记录,有效的标准同样是清晰、完整、准确,只有这样,数据使用获得的收益才能够被可信地统计和分配。


这两项只有同时得到满足,数据所有者的权益才能够真正得到保障,Royalty Engine 才能够行之有效。


关于第一条,Codatta 构建了数据血缘系统来进行数据的全链路追溯,精确关联各个环节和对应的数据贡献者,进而实现数据的确权。


但是在数据的使用方面,由于 Codatta 作为一个开放性的平台生态,本身并不直接参与到具体应用的开发和运维中,因为,数据血缘对于数据的具体使用情况目前还是缺乏掌握的。


ERC-8004 作为一个 AI Agent 的协议标准,在 AI Agent 的应用标准方面做了相关约定,其中就涉及到如何对 AI Agent 的应用链路进行记录,考虑到 AI Agent 是数据产品当下最重要的需求方,这无疑会给 Codatta 在发挥 Royalty Engine 效用方面带来强有力的支撑。


而反过来,Codatta 的数据血缘也将反哺 AI Agent 的归因分析和效能优化。


因此,打通 Codatta 数据血缘体系和 ERC-8004 之间的接口,将有助于形成一个正向的上升螺旋,实现数据贡献者和应用开发者之间的双赢。


结语


以上内容,主要是从业务角度出发,得出了一些阶段性的思考结论,当然了,也不是纯粹的天马行空,每一种方案也都充分考虑了技术上的可行性,确保不会是无稽之谈或者痴人说梦。


方案好不好还需要实践的检验,但是我们至少得保证它们都是可实现的不是?


话又说回来,可实现,才可以在实践中被检验,是骡子是马,最终还得拉出来溜溜,而不会一直停留在纸上谈兵,口舌之争。


一切秉承我们的老规矩,能动手就别 BB。


接下来,我还会分几期继续展开,具体讲解每种方案在工程实现层面的设计思路与实现方式。


每种方案都有各自的优势与不足,也适用于不同的应用场景。本文并无意定义所谓的“最优解”,也没有真正意义上的最终结论,更多是希望起到抛砖引玉的作用。毕竟,ERC-8004 本身也仍在不断演进的过程中,未来在结合与实现层面上,或许还会出现更多新的可能性,不妨一起保持关注和讨论。

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Codatta
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开