five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

德国弗莱堡大学 发布 EntityNet 数据集, 应用在 计算机视觉、自然语言处理 领域

五号数据雷达开源数据市场2025-05-07 06:4831
EntityNet 是 德国弗莱堡大学 发布的数据集,于 2025-05-05 首发在 arXiv 应用于 计算机视觉、自然语言处理 领域

德国弗莱堡大学 本次发布的数据集 EntityNet, EntityNet是一个包含33M图像和46M文本描述的数据集,通过使用知识图谱和目标网络图像搜索策略创建。数据集涵盖了广泛的视觉实体,特别是动物和植物,以及工具、地理特征、材料和建筑等类别。该数据集的创建过程涉及实体提取、属性生成、查询构建和图像搜索四个主要步骤。EntityNet的创建旨在提高专家领域的性能,并实现视觉世界中训练效率与模型性能之间的良好平衡。数据集在iNaturalist和RareSpecies上的评估表明,与在更多数据上训练的CLIP模型相比,该模型在动物和植物等专家领域具有更高的性能。在通用领域,该模型在低计算需求下表现出色。

查看EntityNet

README 内容: 

 

关于 德国弗莱堡大学 , 德国弗莱堡大学(Albert-Ludwigs-Universität Freiburg)是一所位于德国巴登-符腾堡州弗莱堡的研究型大学,成立于1457年,是欧洲历史最悠久的大学之一。该校在自然科学、人文科学、社会科学等多个领域都有显著的研究成果。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们