图灵公司 本次发布的数据集 STRIDE-QA, STRIDE-QA是一个大规模视觉问答(VQA)数据集,用于物理场景下的自主驾驶中的时空推理。该数据集包含来自东京100小时的多传感器驾驶数据,捕捉了交通拥堵、施工区域和行人密集的交叉路口等多样性和挑战性条件。STRIDE-QA是城市驾驶中时空推理的最大VQA数据集,提供超过285K帧的16M QA对。该数据集通过密集的自动生成注释,包括3D边界框、分割掩码和多对象跟踪,通过三个新颖的QA任务支持对象中心、自我中心和时空推理。这些任务要求空间定位和短期预测,为下游规划和决策中的安全关键城市环境提供了系统性的测量。通过将每个QA对建立在物理和时序一致的注释中,STRIDE-QA为在现实世界自动驾驶中进行训练和基准测试的VLMs提供了全面的基础。
关于 图灵公司 , 图灵公司是一家专注于人工智能和数据科学领域的科技公司,致力于通过创新技术解决复杂的计算问题,提供包括机器学习、数据分析和自动化解决方案等服务。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)