北京大学本次发布的数据集ActiveViewPose-200K; ActiveManip-Bench,ActiveViewPose-200K是由北京通用人工智能研究院构建的大规模语义相机控制数据集,包含20万条高质量图像-语言-相机运动配对数据,具有精细的任务导向标注。该数据集通过多模态对齐技术构建,支持机器人学习任务相关的视角调整能力。ActiveManip-Bench是首个针对主动操作的仿真基准,涵盖12类复杂任务、100个家居对象和20种场景配置,解决了固定视角评估的局限性。两者共同服务于机器人主动感知与操作系统的研发,推动视觉-语言-动作模型的场景适应能力突破。
查看ActiveViewPose-200K; ActiveManip-Bench
关于北京大学,北京大学是中国著名的综合性研究型大学,创建于1898年,前身为京师大学堂。作为中国最高学府之一,北京大学在多个学科领域具有重要影响力,拥有众多国家重点实验室和研究中心。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)