复旦大学本次发布的数据集GlyphCorrector,GlyphCorrector是由复旦大学与南洋理工大学联合构建的区域级字形偏好数据集,包含7,117张基于879组提示-字形条件生成的图像,覆盖中英文复杂字符。该数据集通过人工标注正确与错误的局部字形区域(如笔画缺失或冗余),为文本渲染模型提供细粒度优化依据。其构建过程包括:1)从合成文本图像中采样条件;2)替换字符生成新组合;3)人工标注局部字形错误。该数据集旨在解决多语言场景下字形生成不准确的问题,尤其针对OCR模型难以识别的精细笔画错误,推动视觉文本生成在广告设计、多语言界面等领域的精准应用。
关于复旦大学,复旦大学是中国一所著名的综合性研究型大学,位于上海市,创建于1905年,是中国顶尖的高等教育机构之一,以学术研究和人才培养著称。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)