five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】JDocQA - 日语文档问答数据集

五号雷达开源数据市场2024-03-30 10:0055
JDocQA是一个高质量、实用的日语文档问答数据集,为研究者和开发者提供了一个评估和提升大模型在日语文档问答任务上性能的宝贵资源。

JDocQA是奈良先端科学技术大学院大学等机构联合构建的一个大规模日语文档问答数据集。该数据集包含5,504份PDF文档及11,600个日语标注的问答实例,每个问答实例都包括对文档页面的引用和答案线索的边界框。数据集涵盖了多种问题类别,包括是非题、事实题、数值题和开放式问题,且特别引入了无答案的问题。数据文档源自公共领域,如政府宣传册和网站,并通过人工注释问答对。JDocQA是一个高质量、实用的日语文档问答数据集,为研究者和开发者提供了一个评估和提升大模型在日语文档问答任务上性能的宝贵资源。

详情请参见五号雷达:https://www.5radar.com/result?key=JDocQA

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们