five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Ruo Zhi Ba 发布 Chumor 数据集, 应用在 自然语言处理、幽默理解 领域

五号数据雷达开源数据市场2025-10-02 02:3120
Chumor 是 Ruo Zhi Ba 发布的数据集,于 2025-10-02 首发在 arXiv 应用于 自然语言处理、幽默理解 领域

Ruo Zhi Ba 本次发布的数据集 Chumor, 该数据集名为Chumor,来源于类似中国Reddit的平台——糗事百科,包含了带有解释的笑话,旨在帮助评估大型语言模型对幽默理解的能力。Chumor是首个中文幽默解释数据集,为最先进的语言模型提供了一个具有挑战性的基准。该数据集规模涵盖了1951个笑话,总计超过151,730个中文字符的解释内容,其任务是对幽默理解和解释进行评估。

查看Chumor

README 内容: 

 

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们