Open-source 本次发布的数据集 HueManity, 该数据集名为HueManity,包含了83,850张图片,这些图片以石原测试风格的点阵图案中嵌入双字符字母数字字符串的形式呈现,旨在评估机器学习模型中的视觉感知能力。此外,该数据集还包括了专门针对不同任务的子集:数字识别集(1,000张图片)和文本识别集(1,000张图片),它们各自专注于不同类型的字符。总的来说,这个数据集共有83,850张图片,其任务是评估多语言机器学习模型(MLLMs)的视觉感知能力。
README 内容:
关于 Open-source , -
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)