five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

复旦大学发布GlyphCorrector数据集,应用在字形校正、文本渲染领域

五号数据雷达开源数据市场2026-03-18 04:2914
GlyphCorrector是复旦大学发布的数据集,于2026-03-17首发在arXiv应用于字形校正、文本渲染领域

复旦大学本次发布的数据集GlyphCorrector,GlyphCorrector是由复旦大学与南洋理工大学联合构建的区域级字形偏好数据集,包含7,117张基于879组提示-字形条件生成的图像,覆盖中英文复杂字符。该数据集通过人工标注正确与错误的局部字形区域(如笔画缺失或冗余),为文本渲染模型提供细粒度优化依据。其构建过程包括:1)从合成文本图像中采样条件;2)替换字符生成新组合;3)人工标注局部字形错误。该数据集旨在解决多语言场景下字形生成不准确的问题,尤其针对OCR模型难以识别的精细笔画错误,推动视觉文本生成在广告设计、多语言界面等领域的精准应用。

查看GlyphCorrector

关于复旦大学,复旦大学是中国一所著名的综合性研究型大学,位于上海市,创建于1905年,是中国顶尖的高等教育机构之一,以学术研究和人才培养著称。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们