five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】Entity6K - 现实世界大型开放领域实体识别数据集

五号雷达开源数据市场2024-03-22 13:5680
Entity6K是微软和卡内基梅隆大学提出的一个全面的、用于现实世界实体识别的数据集。

Entity6K是微软和卡内基梅隆大学提出的一个全面的、用于现实世界实体识别的数据集。该数据集包含了5,700个实体,涵盖26个类别,每个实体都有5张经过人工验证的图像及其对应的标注(边界框和文本描述)。构建数据集时,研究人员首先通过Wikipedia等资源编制了一个多样化的实体名单,并将其分为26个类别。随后使用这些实体名称作为搜索查询,在Flickr上收集图像并通过Amazon Mechanical Turk进行图像质量评估,确保图像准确代表其对应的实体。Entity6K数据集对于推动开放领域实体识别技术的发展具有重要意义,它不仅提供了一个多样化和高质量的评估基准,还为未来的研究提供了丰富的资源和挑战。

详情请参见五号雷达:https://www.5radar.com/result?key=Entity6K
数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们