首页 / 开源数据市场 / 正文

北京交通大学联合字节跳动发布TextSculpt-Data大规模数据集填补场景文本编辑领域数据空白

五号数据雷达开源数据市场2026-05-22 05:2813

北京交通大学联合字节跳动于2026年5月20日在arXiv首发320万级高保真场景文本编辑数据集TextSculpt-Data，将为场景文本编辑、文本视觉生成领域AI模型训练及标准化评估提供核心数据支撑，破解当前行业开源训练数据稀缺、评估标准缺失的发展痛点。

近年来，随着AIGC技术在电商运营、广告传媒、影视后期、自动驾驶仿真等多个领域的落地应用，场景文本编辑、高精度文本视觉生成技术的市场需求快速攀升。但长期以来，该领域面临开源高质量训练数据供给不足、行业统一评估标准缺失的核心瓶颈，制约了相关AI模型的性能迭代与场景落地。2026年5月20日，北京交通大学联合字节跳动正式在arXiv首发大规模高保真场景文本编辑数据集TextSculpt-Data，瞄准上述行业痛点定向研发。

据公开信息显示，TextSculpt-Data总计包含320万条训练数据，其中涵盖120万条经过OCR验证的文本到图像样本，以及200万对源-目标图像对齐、背景一致性强的文本编辑配对样本，数据生成链路融合了基于VLM的标题改写、高质量图像合成以及程序化文本渲染与合成技术，全流程采用自动化流水线构建，通过程序化渲染能力确保文本编辑操作的精确性，同时严格保留编辑区域外的背景内容不变，数据质量适配高要求的模型训练需求。

该数据集主要面向场景文本编辑领域开放，支持文本添加、替换、删除和混合编辑等核心任务的模型训练与效果评估，可有效提升相关模型在文本渲染精度、编辑后视觉真实性等维度的表现。从落地场景来看，基于该数据集优化后的模型，有望在多个领域发挥价值：在电商运营场景中，可实现商品主图、详情页的促销文案、规格参数快速修改，无需重新制图即可生成合规的宣传物料，大幅降低商家运营成本；在广告传媒场景中，可支持户外广告、线下海报的本地化文案一键替换，满足不同区域、不同活动的物料差异化需求；在影视后期制作场景中，可快速修改场景内的招牌、字幕等文字内容，缩减后期制作周期；在自动驾驶仿真场景中，可生成多变体的路牌、交通标识训练数据，提升自动驾驶模型对复杂道路文本信息的识别鲁棒性；在AIGC内容创作场景中，也可解决当前生成式图像常见的文字错乱、字形失真等问题，提升AI生成海报、插画等内容的可用性。

作为数据要素市场中垂直领域的高质量标注数据资产，TextSculpt-Data的发布不仅填补了场景文本编辑领域的开源数据缺口，也为该领域的技术评估提供了标准化的参考基准，将进一步推动文本视觉生成技术的迭代与产业落地，助力AIGC细分场景的数字化应用深化。

查看TextSculpt-Data

详情页内容：

社区讨论

近期热门

北京交通大学联合字节跳动发布TextSculpt-Data大规模数据集 填补场景文本编辑领域数据空白

详情页内容：

社区讨论

北京交通大学联合字节跳动发布TextSculpt-Data大规模数据集填补场景文本编辑领域数据空白