南京理工大学 本次发布的数据集 Dataset of Explanatory CV Tasks (DECVT), Dataset of Explanatory CV Tasks (DECVT) 是由南京理工大学、东南大学和百度联合构建的大规模数据集,包含1200万条“图像输入→解释性指令→输出”三元组数据。该数据集通过详细的解释性指令,直观地描述了计算机视觉任务的目标,涵盖了从图像到输出的多种变换过程。数据集分为“术语化视觉任务”和“解释性视觉任务”两部分,前者包括图像恢复、去雨、去雾等低层次视觉任务,后者则通过自然语言指令描述复杂的图像编辑任务。DECVT旨在通过训练自回归视觉语言模型(AR-based VLM),提升模型在指令级和任务级的零样本泛化能力,推动计算机视觉领域的统一和多样化发展。
查看Dataset of Explanatory CV Tasks (DECVT)
README 内容:
关于 南京理工大学 , 南京理工大学是位于中国江苏省南京市的一所综合性全国重点大学,隶属于工业和信息化部。学校以工为主,理工结合,涵盖工、理、管、文、经、法、教育、艺术等多个学科门类。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)