德国罗斯托克大学 本次发布的数据集 Hierarchical Feature Generation Framework (HFGF) Benchmark Datasets, 本文介绍了一个名为HFGF的层次特征生成框架,用于生成保留数据集中属性间依赖关系的合成表格数据。该框架由德国罗斯托克大学计算机科学学院的研究团队提出,旨在解决现有生成模型在隐私敏感领域,如医疗保健,中难以保留属性间关系的问题。HFGF首先使用标准生成模型生成独立特征,然后根据预定义的函数依赖(FD)和逻辑依赖(LD)规则重构依赖特征。该框架通过在四个具有不同大小、特征不平衡和依赖复杂性的基准数据集上的实验,证明了其在六种生成模型中提高了FD和LD的保留程度。HFGF能够显著提高合成表格数据的结构保真度和下游实用性。
查看Hierarchical Feature Generation Framework (HFGF) Benchmark Datasets
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)