本次发布的数据集 cmt-benchmark-nq, NQ数据集是cmt-benchmark项目的一部分,是经过筛选和处理的NQ原始数据集的版本。该数据集包含能够从原始维基百科页面中恢复出金标准段落并且有一个短答案(少于5个词)的样本。数据集分为gpt2-xl和pythia-6.9b两个版本,每个版本都包含验证集和测试集。数据集的列包括样本ID、上下文类型、模板、真实答案、新答案、提示、问题、上下文等。数据集的创建包括从NQ开发样本中提取信息,处理维基百科页面,生成提示和上下文,以及使用LLM生成新的目标答案。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)