five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

北京大学发布SynthGlyph Dataset, DesignText Dataset数据集,应用在字符生成、图形设计领域

五号数据雷达开源数据市场2025-12-25 20:0570
SynthGlyph Dataset, DesignText Dataset是北京大学发布的数据集,于2025-12-24首发在arXiv应用于字符生成、图形设计领域

北京大学本次发布的数据集SynthGlyph Dataset, DesignText Dataset,SynthGlyph Dataset是由北京大学王选计算机研究所构建的大规模合成字符数据集,包含4194种TrueType字体渲染的6857个字符,总计约2880万条实例,支持中英文字符及符号的多样化风格迁移。DesignText Dataset则聚焦真实设计场景,收录11.55万条设计样本,涵盖背景图、文本描述及细粒度标注,通过自动化流程整合多源数据。两数据集采用合成渲染与真实标注相结合的方法构建,旨在解决图形设计中风格化文本编辑与生成的难题,为AI辅助平面设计提供高精度训练资源。

查看SynthGlyph Dataset, DesignText Dataset

关于北京大学,北京大学是中国著名的综合性研究型大学,创建于1898年,是中国近代第一所国立大学。学校在文、理、医、工等多个学科领域具有重要影响力,被誉为中国最高学府之一。

关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们