随着全球DeFi(去中心化金融)市场的持续发展,公链上去中心化交易所的日交易订单量已达可观规模,但其背后的研究支撑体系长期存在明显短板:过往量化策略研发、交易过滤规则设计均仅基于成交成功的订单数据,忽略了大量被拒绝的订单样本,极易产生样本选择偏差,导致策略回测失真、风控规则有效性不足等问题,而行业此前始终没有公开的标准化拒绝交易事件数据集可供研究使用。近日,独立研究员Arati Kamat发布的RED-2400数据集正式填补了这一空白,该数据集是全球首个专注于算法化拒绝交易事件的公开基准数据集,于2026年5月12日首发于预印本平台arXiv。
据公开信息显示,RED-2400的原始数据来自2026年4月10日至5月2日期间对Solana生态去中心化交易所的全量运行日志持续采集,累计覆盖6,659个经标准化标注的拒绝交易事件,关联169,122条拒绝事件发生后的链上价格、流动性观测记录,同时收录了1,836个对应交易请求的全生命周期快照,完整还原了订单从发起、路由、执行到最终被拒绝的全流程特征。为保障数据合规性与参与方隐私,所有数据均经过匿名化处理,不涉及任何用户身份信息与机构操作机密;同时数据集采用确定性五级分类规则对拒绝事件进行标注,分类标签包含挽救、错过、持平多个维度,研究人员可直接调用开展分类研究,无需额外开展数据清洗、标注工作。
从应用价值来看,RED-2400可广泛覆盖量化金融、DeFi算法决策系统两大核心领域的研究与落地需求:其一,可为量化机构的交易过滤规则提供精度审计工具,研究人员可基于该数据集验证不同过滤规则对无效订单的拦截效率,帮助机构降低无效Gas费损耗;其二,可支撑交易策略的反事实评估研究,通过对比拒绝订单如果成交后的市场表现,修正现有策略仅基于成交样本产生的回测偏差,提升策略在真实链上环境的运行胜率;其三,可填补拒绝交易样本的研究空白,帮助DEX平台优化订单匹配算法、流动性调度机制,降低正常订单的拒绝概率,提升用户交易体验。当前数据要素市场正加速向垂直细分领域延伸,Web3领域的高质量标注数据集一直是行业稀缺资源,RED-2400的发布不仅为去中心化交易领域的学术研究提供了标准化基准样本,也为Web3量化行业的合规、高效发展提供了实证数据支撑,后续随着更多垂直场景数据集的开放,有望进一步推动DeFi交易体系的透明化、规范化发展。





_1769672084863.jpg)