国际数字经济学院(IDEA) 本次发布的数据集 Rexverse-2M, Rexverse-2M数据集由国际数字经济学院(IDEA)开发,旨在支持多模态大语言模型(MLLM)的感知和理解任务的联合训练。该数据集包含200万条图像-区域-文本注释三元组,具有多层次的粒度。数据集的创建过程采用全自动化的数据引擎,包括图像字幕生成、对象或短语对齐以及区域描述细化等模块。Rexverse-2M数据集主要应用于提升MLLM在对象检测、区域理解和图像对话等任务中的表现,旨在解决现有模型在精细感知能力上的不足。
README 内容:
关于 国际数字经济学院(IDEA) , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)