five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】CLIcK - 韩语文化与语言智能数据集

五号雷达开源数据市场2024-03-14 14:1262
CLIcK数据集由韩国科学技术院创建,旨在填补韩语大模型在文化与语言知识评估方面的空白。

CLIcK数据集由韩国科学技术院创建,旨在填补韩语大模型在文化与语言知识评估方面的空白。该数据集包含1995对问答样本,源自官方韩国考试与教科书,覆盖语言和文化两大类,细分为11个子类别,每个样本都提供了细粒度的注释,指明回答问题所需的文化和语言知识。通过官方许可,研究团队从六项韩国考试和一本教科书中提取问题,同时利用GPT-4生成新问题,确保了内容的原创性与文化相关性,经过严格的人工审核与分类,CLIcK最终形成了一个高质量的韩语评估基准。该数据集作为评估韩语语言模型文化与语言理解能力的重要基准,为推动相关领域的研究提供了坚实的数据支撑。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们