中国科学技术大学 本次发布的数据集 Streamer, Streamer数据集是一个包含中文语音和显式语义手势的3D人体运动高质量数据集,主要用于研究直播场景下的手语合成。该数据集包含了一系列预定义的手势(如数字和方向),以及相应的语音音频。Streamer数据集的创建旨在解决现有数据集中缺乏显式语义手势的问题,并通过混合模态扩散Transformer和级联同步检索增强生成技术,实现灵活可靠的人体手势合成。该数据集的应用领域包括电影制作、游戏设计、机器人技术和数字人类创建等。
关于 中国科学技术大学 , 中国科学技术大学是中国的一所综合性研究型大学,位于安徽省合肥市,以培养高水平的创新人才和进行前沿科学研究为己任,是中国著名的高等学府之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)