中国科学院大学 本次发布的数据集 DeepResearch Bench, DeepResearch Bench是一个由100个博士级别的研究任务组成的基准数据集,这些任务由来自22个不同领域的专家精心设计。该数据集旨在评估深度研究代理的能力,这些代理通过自主组织多步骤的网络探索、有针对性的检索和高级别的合成,将大量的在线信息转化为分析师级别的、引用丰富的报告。数据集包含50个中文任务和50个英文任务,每个任务都经过迭代优化,以确保其真实反映实际研究需求。该数据集的创建过程包括对96,147个真实用户查询的统计分析,以及由具有丰富经验的专家提出和筛选的任务。DeepResearch Bench不仅用于评估深度研究代理的生成报告质量,还用于评估其信息检索和收集能力。
README 内容:
关于 中国科学院大学 , 中国科学院大学,简称“中科院大学”,位于北京,是经中国政府批准,由中国科学院承办的一所以自然科学为主,兼有管理与人文学科的研究型全国重点大学。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)