five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Baidu AI 发布 SAOKE 数据集, 应用在 信息提取、自然语言处理 领域

五号数据雷达开源数据市场2025-10-07 12:3321
SAOKE 是 Baidu AI 发布的数据集,于 2025-10-07 首发在 arXiv 应用于 信息提取、自然语言处理 领域

Baidu AI 本次发布的数据集 SAOKE, 该数据集包含了由众包方式标注的超过四万句句子及其对应的SAOKE格式的事实,专门用于开放信息提取任务。此外,SAOKE数据集是目前公开可用的最大的人力标注数据集,用于开放信息提取任务,其句子和事实涵盖了广泛的不同领域。该数据集规模宏大,包含超过四万句句子和大约十万条事实。其任务目标是开放信息提取。

查看SAOKE

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们