复旦大学本次发布的数据集AVGen-Bench,AVGen-Bench是由微软亚洲研究院等机构联合构建的文本-音视频生成评估基准,包含235条精心设计的跨场景提示词,覆盖专业媒体制作、创作者经济、物理世界模拟三大领域11个子类别。数据集采用任务驱动型构建策略,通过GPT-5.2生成候选提示后人工筛选,平均每条提示包含88.54个token,44%涉及语音合成,88%包含环境音效。其创新性在于解耦提示设计与其评估指标,聚焦细粒度语义对齐能力,如音乐音高控制、物理规律模拟等,为多模态生成模型的语义可控性提供标准化测试框架。
关于复旦大学,复旦大学是中国一所著名的综合性研究型大学,位于上海市,创建于1905年,是中国顶尖的高等教育机构之一,以文理医工等多学科协调发展著称。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)