five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Glint Lab发布UniDoc-RL数据集,应用在视觉文档检索、多模态强化学习领域

五号数据雷达开源数据市场2026-04-19 05:1731
UniDoc-RL是Glint Lab发布的数据集,于2026-04-16首发在arXiv应用于视觉文档检索、多模态强化学习领域

Glint Lab本次发布的数据集UniDoc-RL,UniDoc-RL是由Glint Lab构建的高质量视觉文档检索增强生成(RAG)数据集,旨在支持多模态强化学习研究。该数据集包含丰富的推理轨迹数据,并带有细粒度的动作标注,为模型训练提供了详尽的监督信号。数据来源包括复杂视觉文档(如图表、扫描报告)的检索、选择及感知过程,通过层次化动作空间实现从粗粒度到细粒度的语义对齐。该数据集主要应用于提升大型视觉语言模型(LVLM)在复杂视觉推理任务中的性能,解决现有视觉RAG系统在检索准确性、视觉利用效率和优化奖励机制方面的核心挑战。

查看UniDoc-RL

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们