five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

发布QUIET数据集,应用在创意文本生成评估、故事完形填空基准领域

五号数据雷达开源数据市场2026-06-01 10:0011
QUIET是发布的数据集,于2026-05-25首发在arXiv应用于创意文本生成评估、故事完形填空基准领域

本次发布的数据集QUIET,QUIET数据集是一个用于评估大语言模型创意生成能力的多空白级联故事完形填空基准,由研究者Bo Zou和Chao Xu创建。该数据集包含具有完整叙事结构的文本,其中设置了10至20个空白位置,每个空白附带明确的内容约束,且空白之间存在级联依赖关系。数据规模涉及36个空白填充实例,通过自动化信息论评分协议进行客观评估。数据集的构建过程基于“校准惊喜”理论框架,将创意质量量化为约束满足度与惊喜度的乘积。该数据集主要应用于自然语言处理领域,旨在解决现有基准无法客观、自动化评估模型开放式创意生成能力的核心问题,为LLM的叙事连贯性和创造性决策能力提供诊断工具。

查看QUIET

详情页内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们