美团本次发布的数据集LARYBench,LARYBench是由美团团队构建的大规模多模态基准数据集,旨在评估视觉到动作的潜在表征能力。该数据集包含151个动作类别的120万条视频(总时长超1000小时)、62万张图像对及59.5万条运动轨迹,覆盖人类活动和11种机器人平台的多场景数据。通过自动化数据引擎对原始视频进行精细化分割和标注处理,数据集包含从原子级运动基元到复合行为的多层次语义信息。主要应用于跨智能体的视觉-动作对齐研究,解决机器人控制中缺乏通用性动作表征的难题,为视觉语言动作模型提供标准化评估框架。
关于美团,美团是中国领先的生活服务电子商务平台,成立于2010年,总部位于北京。公司通过其移动应用和网站提供餐饮外卖、酒店预订、电影票务、休闲娱乐等多种服务,致力于为用户提供便捷的生活服务体验。美团已成为中国互联网行业的领军企业之一,并在全球范围内具有重要影响力。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)