five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

阿里巴巴国际数字商业 发布 HSCodeComp 数据集, 应用在 商品分类、自动化推理 领域

五号数据雷达开源数据市场2025-10-24 14:0130
HSCodeComp 是 阿里巴巴国际数字商业 发布的数据集,于 2025-10-22 首发在 arXiv 应用于 商品分类、自动化推理 领域

阿里巴巴国际数字商业 本次发布的数据集 HSCodeComp, HSCodeComp是一个真实且具有专家级水平的数据集,用于评估深度搜索代理在分层规则应用中的能力。该数据集由大型电子商务平台收集的真实世界数据构建,包含632个产品条目,涵盖27个独特的HS章节和32个不同的第一级类别。这些HS代码由多位电子商务领域专家严格标注,确保HSCodeComp具有专家级水平。准确预测精确的10位HS代码提出了重大挑战:代理必须执行多跳分层推理,同时处理包含缩写、语言变化或不完整信息的嘈杂但真实的产品描述。

查看HSCodeComp

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 阿里巴巴国际数字商业 , 阿里巴巴集团是一家总部位于中国杭州的全球化互联网公司,主要从事电子商务、云计算、数字媒体和娱乐业务。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们