谷歌DeepMind 本次发布的数据集 What Are You Doing? (WYD), ‘What Are You Doing?’(WYD)是由谷歌DeepMind创建的一个新基准数据集,旨在对可控图像到视频生成中的人类进行细粒度评估。该数据集包含1544个配有字幕的视频,经过精心收集和标注,分为56个细粒度类别。数据集涵盖各种人类行为、互动和运动,为视频生成模型提供了丰富多样的测试素材。通过9个类别和56个子类别的详细标注,WYD能够系统地评估视频级和人类级生成的关键方面,推动人类视频生成模型的研究与发展。
README 内容:
关于 谷歌DeepMind , 谷歌DeepMind是谷歌旗下专注于人工智能和机器学习的研究机构,成立于2010年,总部位于英国伦敦。DeepMind致力于开发先进的AI技术,解决复杂问题,并在多个领域取得了突破性进展,如AlphaGo在围棋领域的成功。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)