韩国科学技术院本次发布的数据集Touch-and-Go (TG); Web-Material,该研究构建了Touch-and-Go (TG)和Web-Material两个触觉-视觉对齐数据集,旨在解决跨模态材料分割任务。Web-Material包含约1.7万张从网络采集的野外场景图像,覆盖多种材料类别,并通过大语言模型生成多样化查询词增强数据多样性。数据集通过CLIP相似度过滤误分类样本,确保材料标注准确性。其核心创新在于提出材料多样性配对策略,将触觉信号与视觉多样的同类别图像对齐,用于训练局部跨模态特征匹配模型,推动机器人触觉感知与场景理解的研究。
查看Touch-and-Go (TG); Web-Material
关于韩国科学技术院,韩国科学技术院(KAIST)是韩国顶尖的理工类研究型大学,成立于1971年,位于大田广域市,以科技创新和工程教育闻名。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)