香港中文大学本次发布的数据集HOIVG-Bench,HOIVG-Bench是由香港中文大学、字节跳动等机构联合构建的综合性评估基准,专注于人-物交互视频生成(HOIVG)任务的多模态条件验证。该数据集通过整合文本提示、参考图像、音频和姿态序列等异构数据,填补了该领域标准化评估工具的空白。其设计采用严格的五元组数据配对(条件输入与目标视频),支持对生成视频的视觉质量、跨模态对齐精度等核心指标进行系统化测评。作为OmniShow框架的配套基准,它为解决电商展示、短视频制作等实际应用中的可控视频生成难题提供了量化研究基础。
关于香港中文大学,香港中文大学是一所位于中国香港的公立研究型综合大学,成立于1963年,以双语教育、书院制度和研究卓越著称。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)