阿里巴巴国际数字商业 本次发布的数据集 HSCodeComp, HSCodeComp是一个真实且具有专家级水平的数据集,用于评估深度搜索代理在分层规则应用中的能力。该数据集由大型电子商务平台收集的真实世界数据构建,包含632个产品条目,涵盖27个独特的HS章节和32个不同的第一级类别。这些HS代码由多位电子商务领域专家严格标注,确保HSCodeComp具有专家级水平。准确预测精确的10位HS代码提出了重大挑战:代理必须执行多跳分层推理,同时处理包含缩写、语言变化或不完整信息的嘈杂但真实的产品描述。
Dataset card 内容:
Files and versions 内容:
关于 阿里巴巴国际数字商业 , 阿里巴巴集团是一家总部位于中国杭州的全球化互联网公司,主要从事电子商务、云计算、数字媒体和娱乐业务。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)