币安风控团队联合学术界提出了基于「AI + 区块链图谱分析」的新型检测系统,用于检测女巫地址,它是如何做到的?
撰文:Nicky,Foresight News
本文基于《Detecting Sybil Addresses in Blockchain Airdrops: A Subgraph-based Feature Propagation and Fusion Approach》论文内容编译整理
近日币安风控部门联合 Zand AI 部门与 ZEROBASE 共同发布了一篇关于女巫攻击的论文,为帮助读者快速了解论文核心内容,笔者在研读论文后总结出以下关于该论文的核心内容。
在加密货币空投活动中,总有一群特殊玩家在阴影中运作。他们并非普通用户,而是利用自动化脚本批量创建数百甚至数千个虚假地址 — 这就是臭名昭著的「女巫地址」。这些地址像寄生虫般吸附在 Starknet、LayerZero 等知名项目的空投活动中。它们蚕食项目方预算,稀释真实用户奖励,更破坏区块链公平性的根基。
面对这场持续的技术猫鼠游戏,币安风控团队联合学术机构开发出一套名为「基于子图的 lightGBM」的 AI 检测系统,在真实数据测试中识别准确率达 90%。
为什么这些作弊地址能被精准锁定?研究团队通过分析 193,701 个真实地址(其中 23,240 个被确认为女巫地址)的交易记录,发现它们必然留下三类行为痕迹:
时间指纹是首要破绽。女巫地址的操作具有诡异的「精准卡点」特性:从首次接收燃料费(gas fee)、完成第一笔交易到参与空投活动,这些关键步骤通常在极短时间内密集完成。相比之下,真实用户的操作时间分布是随机的,毕竟没人会为领一次空投专门创建地址,用完立刻废弃。
资金轨迹则暴露了经济动机。这些地址的余额永远维持在「够用就好」的状态:略高于空投门槛的最低金额(节省资金成本),一旦收到奖励便火速转出。更明显的是,它们批量操作时转账金额呈现高度一致性,不像真实用户交易存在自然波动。
关系网络成为终极证据。通过构建交易图谱,团队观察到三种典型拓扑结构:
这些模式暴露了程序化操作的协同性,也是传统检测手段最难模仿的特征。
追踪整个区块链的交易数据如同大海捞针。该研究团队采用两层交易子图模型 — 就像侦探调查时,不仅看目标人物(地址 A),还查他的直接联系人(给 A 转账的地址、A 转账过的地址)以及这些联系人的关联方(二级关系)。
更重要的是独创的「特征融合技术」:系统将邻居地址的行为特征聚合成目标地址的「行为档案」。例如统计某个地址所有关联方转出金额的最小值、最大值、平均值、波动幅度,形成描述资金流动规律的复合指标;或是计算邻居们的入度出度(关联地址数量)判断网络密度。这种设计让系统在分析超 580 万笔交易时仍保持高效性,避免了传统方法追踪全网数据的计算灾难。
这套系统在币安灵魂绑定代币(BAB)的真实空投数据中经受住了考验。BAB 是币安 2022 年推出的灵魂绑定代币,用于验证完成 KYC 的真实用户身份,因此成为检测女巫行为的理想试验场。
团队首先通过人工分析和聚类筛选出可疑地址,设立申诉审核机制确认最终的女巫地址标签。清洗数据时排除机构地址(如交易所热钱包)、智能合约和存活超 1 年的地址(女巫为避检测常废弃旧地址),确保数据集的纯净性。
结果显示,新方法对三类作弊网络的识别率达到了较高的精度:
四大核心指标全部突破 0.9: 精确率达 0.943(旧最优模型为 0.796)、召回率达 0.918(意味超 91% 的女巫地址被捕获)、F1 综合分数达 0.930、AUC 值达 0.981(接近完美分类)。这意味着项目方可大幅减少误伤真实用户的风险,同时堵住作弊漏洞。
该技术当前主要适用于长期空投场景(如分阶段发放的灵魂绑定代币),因为这类活动能积累足够的标签数据供 AI 学习。在区块链兼容性上,它支持以太坊虚拟机(EVM)兼容链(如 BNB Chain、Polygon),暂不适用于比特币等 UTXO 模型链,不过论文指出,高 Gas 成本使空投活动极少在 UTXO 链开展,实际影响有限。
研究团队强调,此技术的潜力远超空投领域。由于它通过交易网络与行为模式识别异常,同样可应用于:
随着女巫攻击策略持续进化,这场守护 Web3 公平性的技术军备竞赛,将推动检测系统向更智能、更通用的方向迭代发展。
原文链接:https://arxiv.org/abs/2505.09313
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。