清华大学 本次发布的数据集 AgentRecBench, AgentRecBench是一个用于评估基于大型语言模型(LLM)的智能体推荐系统的综合基准。该基准通过处理Yelp、GoodReads和Amazon数据集构建了一个统一的文本交互环境,提供了标准化的功能接口,使智能体能够在各种条件下进行灵活的信息检索。它包含了三个典型的评估场景:经典推荐、兴趣演变和冷启动推荐任务。该基准为开发和研究智能体推荐系统提供了一个模块化框架,并比较了10种经典和智能体推荐方法。
Dataset card 内容:
Files and versions 内容:
关于 清华大学 , 清华大学,位于中国北京,是一所享誉全球的顶尖研究型大学,以其深厚的学术底蕴和杰出的科研能力而著称。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)