Ruo Zhi Ba 本次发布的数据集 Chumor, 该数据集名为Chumor,来源于类似中国Reddit的平台——糗事百科,包含了带有解释的笑话,旨在帮助评估大型语言模型对幽默理解的能力。Chumor是首个中文幽默解释数据集,为最先进的语言模型提供了一个具有挑战性的基准。该数据集规模涵盖了1951个笑话,总计超过151,730个中文字符的解释内容,其任务是对幽默理解和解释进行评估。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)