华南理工大学 本次发布的数据集 Explainable Tampered Text Detection (ETTD), ETTD数据集是由华南理工大学和蚂蚁集团联合创建的,旨在支持可解释的篡改文本检测任务。该数据集包含21000张图像,其中包括11000张经过篡改的文本图像和10000张真实文本图像,涵盖多语言卡片、文档和场景文本等多种场景。数据集通过多种篡改方法(如复制移动、拼接和生成文本编辑)生成,并使用Poisson Blending技术减少视觉不一致性。数据集的创建过程包括从互联网和现有数据集中收集图像,进行文本篡改,并使用GPT4o生成异常描述。ETTD数据集主要应用于信息安全领域,旨在解决文本图像篡改检测中的黑箱问题,提供可靠的预测和解释。
查看Explainable Tampered Text Detection (ETTD)
关于 华南理工大学 , 华南理工大学是一所综合性高等学府,致力于培养高等学历理工人才,并推动科技文化发展。其业务涵盖工学、理学、管理学、经济学、法学、文学和哲学等多个学科领域,提供从高等专科到博士研究生学历教育及博士后培养。2023年10月31日,该校的一项关于氢氧发生器中关键电极材料的电化学测试数据在广东省数据知识产权存证登记平台完成了登记,显示出华南理工大学在科研数据领域的深厚实力和严谨态度。此数据集专注于氢氧发生器的关键电极材料,对新能源领域的研究与应用具有重要价值。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)