南京大学本次发布的数据集Multi-Attribution BenChmark (MAC),MAC是由阿里巴巴·淘宝天猫集团与南京大学联合构建的首个公开多归因转化率(CVR)预测基准数据集,旨在解决传统单归因标签的数据局限性。该数据集包含7900万条广告点击样本,涵盖用户行为序列、商品特征及四种归因机制(末次点击、首次点击、线性分配和数据驱动归因)的连续权重标签,数据源自淘宝平台21天的脱敏流量日志。通过分层采样确保数据多样性,并采用哈希技术保护用户隐私。MAC为研究多视角归因学习提供了标准化测试环境,可应用于计算广告、推荐系统等领域,以提升转化路径分析和竞价模型性能。
查看Multi-Attribution BenChmark (MAC)
关于南京大学,南京大学是中国江苏省南京市的一所综合性研究型大学,创建于1902年,是中国著名的‘双一流’建设高校之一,以文理学科见长,在国内外享有较高声誉。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)