近年来,随着AIGC技术在电商运营、广告传媒、影视后期、自动驾驶仿真等多个领域的落地应用,场景文本编辑、高精度文本视觉生成技术的市场需求快速攀升。但长期以来,该领域面临开源高质量训练数据供给不足、行业统一评估标准缺失的核心瓶颈,制约了相关AI模型的性能迭代与场景落地。2026年5月20日,北京交通大学联合字节跳动正式在arXiv首发大规模高保真场景文本编辑数据集TextSculpt-Data,瞄准上述行业痛点定向研发。
据公开信息显示,TextSculpt-Data总计包含320万条训练数据,其中涵盖120万条经过OCR验证的文本到图像样本,以及200万对源-目标图像对齐、背景一致性强的文本编辑配对样本,数据生成链路融合了基于VLM的标题改写、高质量图像合成以及程序化文本渲染与合成技术,全流程采用自动化流水线构建,通过程序化渲染能力确保文本编辑操作的精确性,同时严格保留编辑区域外的背景内容不变,数据质量适配高要求的模型训练需求。
该数据集主要面向场景文本编辑领域开放,支持文本添加、替换、删除和混合编辑等核心任务的模型训练与效果评估,可有效提升相关模型在文本渲染精度、编辑后视觉真实性等维度的表现。从落地场景来看,基于该数据集优化后的模型,有望在多个领域发挥价值:在电商运营场景中,可实现商品主图、详情页的促销文案、规格参数快速修改,无需重新制图即可生成合规的宣传物料,大幅降低商家运营成本;在广告传媒场景中,可支持户外广告、线下海报的本地化文案一键替换,满足不同区域、不同活动的物料差异化需求;在影视后期制作场景中,可快速修改场景内的招牌、字幕等文字内容,缩减后期制作周期;在自动驾驶仿真场景中,可生成多变体的路牌、交通标识训练数据,提升自动驾驶模型对复杂道路文本信息的识别鲁棒性;在AIGC内容创作场景中,也可解决当前生成式图像常见的文字错乱、字形失真等问题,提升AI生成海报、插画等内容的可用性。
作为数据要素市场中垂直领域的高质量标注数据资产,TextSculpt-Data的发布不仅填补了场景文本编辑领域的开源数据缺口,也为该领域的技术评估提供了标准化的参考基准,将进一步推动文本视觉生成技术的迭代与产业落地,助力AIGC细分场景的数字化应用深化。
首页 / 开源数据市场 / 正文
北京交通大学联合字节跳动发布TextSculpt-Data大规模数据集 填补场景文本编辑领域数据空白
五号数据雷达开源数据市场2026-05-22 05:2813
北京交通大学联合字节跳动于2026年5月20日在arXiv首发320万级高保真场景文本编辑数据集TextSculpt-Data,将为场景文本编辑、文本视觉生成领域AI模型训练及标准化评估提供核心数据支撑,破解当前行业开源训练数据稀缺、评估标准缺失的发展痛点。

社区讨论
近期热门




_1769672084863.jpg)