浙江大学 本次发布的数据集 UniSVG, UniSVG 是一个用于矢量图形理解和生成的大型数据集,包含超过52.8万条多模态数据项,旨在支持多模态大型语言模型(MLLM)的训练和评估。该数据集涵盖了从图像到 SVG 的生成、从文本到 SVG 的生成和 SVG 理解三个主要任务,并包含了一个名为 UniSVG-benchmark 的测试集,用于评估 MLLM 在 SVG 任务上的性能。UniSVG 数据集的创建过程包括数据收集、数据清洗和去重、数据转换和多模态整合等步骤。该数据集的应用领域是矢量图形的理解和生成,旨在解决机器对 SVG 图形的理解和生成能力不足的问题。
Dataset card 内容:
Files and versions 内容:
关于 浙江大学 , 浙江大学是中国的一所综合性全国重点大学,位于浙江省杭州市,是‘双一流’建设高校之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)