本次发布的数据集 SUnsET, SUnsET数据集是一个针对长上下文查询聚焦摘要任务的非结构化证据提取问题的合成数据集。它包含了长文档的各个部分、相关的问题、摘要以及从上下文中提取的证据。数据集是使用GPT 4o Mini通过一个新颖的管道生成的,旨在作为训练数据来训练模型执行长上下文查询聚焦摘要任务,并添加了引用证据的能力。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)