Salesforce 本次发布的数据集 summexecedit, SummExecEdit Benchmark是一个用于评估模型检测和解释摘要中事实不一致能力的基准。该基准基于之前的SummEdits基准,并引入了新的不一致和具有挑战性的摘要,这些摘要通过可执行编辑机制生成。数据集包含4,241个样本,涵盖10个领域,每个样本包含多个字段,如样本ID、文档ID、输入文档、原始摘要、替换文本、编辑后的摘要、解释、领域、模型和编辑类型。
Dataset card 内容:
Files and versions 内容:
关于 Salesforce , Salesforce是全球领先的云计算公司,专注于提供CRM软件和服务。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)