Google 本次发布的数据集 FACTS-grounding-public, FACTS Grounding数据集由Google DeepMind和Google Research开发,旨在评估AI模型在事实性和基础性方面的表现。数据集包含860个由人工制作的示例,用于评估AI系统如何基于给定的上下文生成答案。每个示例包括系统提示、任务和长文档。此外,数据集还包含用于评估模型生成响应的评估提示。数据集的限制包括依赖可能存在噪声的自动化LLM判断模型,以及仅专注于评估长文本输入的基础响应。
Dataset card 内容:
Files and versions 内容:
关于 Google , 谷歌是全球知名的科技公司,专注于互联网服务和产品。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)