POSTECH(浦项科技大学) 本次发布的数据集 未提供具体数据集名称, 该数据集由浦项科技大学的研究团队创建,用于训练和评估3D说话人头部的生成模型。数据集通过大量的2D同步说话脸视频学习得到音频-视觉语音表示,并进一步与3D面部网格结合,构建了丰富的语音-网格同步表示空间。该空间能够捕捉到语音和唇部运动之间的复杂对应关系,用于提高现有3D说话人头模型中唇部同步的感知准确性。
关于 POSTECH(浦项科技大学) , 浦项科技大学(POSTECH)位于韩国浦项市,是一所私立研究型大学,以其在工程、科学、以及商业学科的研究与教育而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)