昆仑万维 本次发布的数据集 Skywork-VL Reward, Skywork-VL Reward是一个大规模的多模态偏好数据集,涵盖了广泛的任务和场景。数据集包含了从标准视觉-语言模型(VLMs)和先进的VLM推理器收集的响应。数据集的创建过程包括三个阶段的数据整理和筛选,最终构建了一个包含约190,000个比较样本的数据集,其中约70%包含图像。该数据集是迄今为止最大和最多样化的多模态偏好集合之一,是Skywork-VL Reward模型强大的泛化能力的核心。
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)