北京大学本次发布的数据集SynthGlyph Dataset, DesignText Dataset,SynthGlyph Dataset是由北京大学王选计算机研究所构建的大规模合成字符数据集,包含4194种TrueType字体渲染的6857个字符,总计约2880万条实例,支持中英文字符及符号的多样化风格迁移。DesignText Dataset则聚焦真实设计场景,收录11.55万条设计样本,涵盖背景图、文本描述及细粒度标注,通过自动化流程整合多源数据。两数据集采用合成渲染与真实标注相结合的方法构建,旨在解决图形设计中风格化文本编辑与生成的难题,为AI辅助平面设计提供高精度训练资源。
查看SynthGlyph Dataset, DesignText Dataset
关于北京大学,北京大学是中国著名的综合性研究型大学,创建于1898年,是中国近代第一所国立大学。学校在文、理、医、工等多个学科领域具有重要影响力,被誉为中国最高学府之一。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)