中国电信人工智能研究院 本次发布的数据集 TeleEgo, TeleEgo是一个用于评估第一人称视角人工智能助手在现实世界场景下能力的长期、流式、全模态基准数据集。数据集包含来自多个参与者的同步视频、音频和文本数据,每个参与者贡献超过14小时的记录。所有数据流都精确地对齐到一个统一的全球时间线上,并丰富了手动编辑的语音转录和视觉叙述,以确保高质量和语义清晰。TeleEgo定义了12个诊断子任务,涵盖三个核心能力:记忆(回忆过去的事件)、理解(解释当前时刻)和跨记忆推理(将遥远的事件联系起来)。它包含3291个人工验证的问答项目,跨越多种问题格式(单选、二选、多选和开放式问题),在流式设置下严格评估。TeleEgo提供了对实际人工智能发展的现实和全面的评估。
关于 中国电信人工智能研究院 , 中国电信人工智能研究院是中国电信下属的研究机构,专注于人工智能领域的研究与应用,推动通信行业与人工智能技术的深度融合。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)