five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Jasper AI发布monet数据集,应用在文本到图像生成、跨模态学习领域

五号数据雷达开源数据市场2026-05-08 05:2311
monet是Jasper AI发布的数据集,于2026-05-07首发在HuggingFace应用于文本到图像生成、跨模态学习领域

Jasper AI本次发布的数据集monet,MONET(大规模、开放、非冗余且丰富的文本到图像数据集)是一个专为训练文本到图像(T2I)系统而设计的大规模、经过筛选的图像-文本数据集。它包含从9个异构开放源(6个真实和3个合成)中经过安全过滤、基于域的过滤、精确和近重复去除以及多视觉-语言模型重新标注后提取的1.049亿高质量图像-文本对。每张图像都附带预计算的嵌入、结构化注释和预编码的VAE潜在表示,以加速下游使用。数据集支持多种任务,包括文本到图像预训练、图像检索和零样本图像分类。MONET的数据字段包括图像和几何信息、多种来源的标注、嵌入和潜在表示、结构化注释以及质量和安全信号。数据集还提供了详细的用法示例,包括如何加载和过滤数据。

查看monet

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们