香港科技大学 本次发布的数据集 LaRA, LaRA数据集是由香港科技大学、阿里巴巴集团通用人工智能实验室和宾夕法尼亚州立大学共同创建的,包含2326个测试案例,跨越四个实际问答任务类别,涵盖三种自然发生的长文本类型。该数据集旨在为评估长文本处理能力提供严格的基准,包含小说、学术论文和财务报表等不同写作风格和信息密度的长文本。LaRA的任务设计考虑到定位信息、比较文本不同部分、内容推理和检测虚构内容等方面,以全面评估LC LLMs和RAG的能力。
README 内容:
关于 香港科技大学 , 香港科技大学是位于中国香港的一所国际知名的研究型大学,以其在工程、商业和管理学科的研究实力著称。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)