商汤科技 本次发布的数据集 GUI-Lasagne, GUI-Lasagne是一个多级别、大规模、高质量的GUI数据集,由商汤科技创建。该数据集包含5.73百万个样本,通过精心设计的规则从现实世界中收集并过滤,以确保数据质量。数据集分三个层级构建:文本/图标识别与定位数据、功能定位数据和GUI导航数据。前两部分构成数据集的90%,以免费方式收集,大大降低了数据收集成本。该数据集旨在增强模型对GUI的理解和定位能力,用于GUI导航任务。
Dataset card 内容:
Files and versions 内容:
关于 商汤科技 , 商汤科技是一家专注于人工智能技术研究和应用的公司,成立于2014年,总部位于香港。公司主要从事计算机视觉和深度学习技术的研发,并在多个行业如安防、金融和医疗等有广泛应用。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)