上海人工智能实验室 本次发布的数据集 Ophora-160K, Ophora-160K是一个大规模、高质量的手术视频-文本对数据集,包含超过16万个视频片段与生成指令的配对。该数据集由叙事性眼科手术视频转换而来,经过文本信息精简和基于动态的筛选过程构建。数据集的创建旨在解决眼科手术视频生成中的隐私保护和高质量标注问题,通过文本引导的视频生成技术,为眼科手术流程的理解和自动化提供了可能。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)