five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

IBM研究院欧洲分部 发布 TDMSci 数据集, 应用在 科学文献标注、NLP研究 领域

五号数据雷达开源数据市场2024-10-12 15:3846
TDMSci 是 IBM研究院欧洲分部 发布的数据集,于 2021-01-26 首发在 arXiv 应用于 科学文献标注、NLP研究 领域

IBM研究院欧洲分部 本次发布的数据集 TDMSci, TDMSci是由IBM研究院欧洲分部在爱尔兰创建的一个专门用于科学文献实体标注的数据集,包含从NLP论文中提取的2000个句子,由领域专家标注了任务(T)、数据集(D)和度量(M)实体。该数据集的创建旨在通过自动构建NLP领域的TDM分类法,帮助研究人员快速理解相关文献或进行可比性实验。数据集的应用领域主要集中在科学出版物摘要和知识发现,旨在解决研究人员在特定领域跟踪所有研究发表的困难,减少研究重复和基准过时的问题。

查看TDMSci

README 内容: 

 

关于 IBM研究院欧洲分部 , IBM研究院欧洲分部是IBM公司在全球设立的研究机构之一,专注于推动技术创新和科学研究,涵盖多个领域如人工智能、云计算和数据分析等。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们