加州大学伯克利分校 本次发布的数据集 EgoSchema, EgoSchema是由加州大学伯克利分校的研究团队创建的一个用于评估长时间视频语言理解能力的诊断基准。该数据集包含超过5000个由人工精心策划的多项选择题答案对,覆盖了250小时的真实视频数据,涵盖了广泛的自然人类活动和行为。每个问题要求根据一个三分钟长的视频片段,在五个给定选项中选择正确答案。EgoSchema旨在通过其长内在时间结构和多样化的复杂性,为开发有效的长期视频理解系统提供宝贵的评估工具。
关于 加州大学伯克利分校 , 加州大学伯克利分校是一所位于美国加州的世界顶级公立研究型大学,以其在科研和创新领域的卓越成就闻名于世。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)