香港中文大学本次发布的数据集Gen-Searcher-SFT-10k; Gen-Searcher-RL-6k,Gen-Searcher-SFT-10k和Gen-Searcher-RL-6k是由香港中文大学MMLab等机构构建的高质量搜索增强图像生成训练数据集,包含约16,000条样本。数据集通过精心设计的提示工程和深度网络搜索策略生成,涵盖20多个多样化领域,如动漫、艺术、物理等。数据创建过程涉及多轮代理搜索轨迹生成和基于Nano Banana Pro的图像合成,并经过Seed1.8模型评分和人工验证以确保质量。该数据集旨在解决知识密集型场景下的图像生成问题,为训练搜索增强型图像生成代理提供基础支持。
查看Gen-Searcher-SFT-10k; Gen-Searcher-RL-6k
关于香港中文大学,香港中文大学是香港的一所公立研究型大学,成立于1963年,以双语教育和国际研究著称,在多个学科领域具有较高的学术声誉。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)