five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

香港中文大学发布Gen-Searcher-SFT-10k; Gen-Searcher-RL-6k数据集,应用在图像生成、搜索增强领域

五号数据雷达开源数据市场2026-04-01 05:0233
Gen-Searcher-SFT-10k; Gen-Searcher-RL-6k是香港中文大学发布的数据集,于2026-03-31首发在arXiv应用于图像生成、搜索增强领域

香港中文大学本次发布的数据集Gen-Searcher-SFT-10k; Gen-Searcher-RL-6k,Gen-Searcher-SFT-10k和Gen-Searcher-RL-6k是由香港中文大学MMLab等机构构建的高质量搜索增强图像生成训练数据集,包含约16,000条样本。数据集通过精心设计的提示工程和深度网络搜索策略生成,涵盖20多个多样化领域,如动漫、艺术、物理等。数据创建过程涉及多轮代理搜索轨迹生成和基于Nano Banana Pro的图像合成,并经过Seed1.8模型评分和人工验证以确保质量。该数据集旨在解决知识密集型场景下的图像生成问题,为训练搜索增强型图像生成代理提供基础支持。

查看Gen-Searcher-SFT-10k; Gen-Searcher-RL-6k

关于香港中文大学,香港中文大学是香港的一所公立研究型大学,成立于1963年,以双语教育和国际研究著称,在多个学科领域具有较高的学术声誉。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们