12月24日,香港大学电机与电子工程系助理教授 Xiaojuan Qi 与腾讯 ARC 实验室的创始人、主任 Ying Shan 博士联合多位研究者发布了 DSR Suite 数据集。这是是一个围绕动态空间推理(Dynamic Spatial Reasoning)构建的数据集,用于支持视觉语言模型(VLM)在 4D 场景下的训练与评测。
数据集地址: DSR Suite
论文地址: Learning to Reason in 4D: Dynamic Spatial Understanding for Vision Language Models 





_1769672084863.jpg)