北京理工大学本次发布的数据集UAV-Track VLA,UAV-Track VLA是由北京理工大学、中国科学院自动化研究所等机构联合构建的首个面向城市复杂场景的无人机视觉-语言-动作追踪基准数据集。该数据集基于CARLA仿真平台构建,包含89.2万帧多模态轨迹数据,覆盖85类动态目标(如车辆、行人)和176项细粒度追踪任务,支持自然语言指令输入与四自由度连续运动控制。数据通过专家演示与人工势场算法混合采集,涵盖动态天气、全距离追踪及目标运动学多样性,旨在解决无人机在语义级动态追踪中的跨模态对齐与实时控制问题,为城市交通监控、紧急搜救等场景提供算法训练基础。
关于北京理工大学,北京理工大学是中国共产党创办的第一所理工科大学,隶属于中华人民共和国工业和信息化部,是全国重点大学,首批进入国家“211工程”和“985工程”建设行列,入选国家“双一流”建设高校。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)