美国中佛罗里达大学 本次发布的数据集 VRU-Accident, VRU-Accident是一个大规模的视觉-语言基准数据集,旨在评估多模态大型语言模型(MLLMs)在高风险交通场景中,特别是涉及脆弱道路用户(VRUs)的场景中的推理和描述能力。该数据集包含1000个真实世界的事故和近事故视频,这些视频被标注了6000个多项选择题问答对,涵盖六个安全关键类别(共有24000个候选选项和3400个独特答案选择),以及1000个密集的场景描述。VRU-Accident数据集的创建过程包括从网络资源中检索事故视频,并由人类专家手动筛选。对于每个视频,首先由人类专家为每个问题标注一组答案,然后VQA生成器生成三个反事实答案,同时使用密集描述生成器为每个视频生成一个密集的事故描述。所有标注均由人类专家验证后最终确定。该数据集的创建旨在解决自动驾驶系统中对脆弱道路用户安全性的挑战,并推动多模态语言模型在交通事故理解和推理方面的研究。
关于 美国中佛罗里达大学 , 美国中佛罗里达大学(University of Central Florida, UCF)是一所位于美国佛罗里达州奥兰多的公立研究型大学,成立于1963年,是美国最大的大学之一,以其在工程学、计算机科学、光学和光子学等领域的卓越研究和教学质量而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)