墨西哥数学研究中心 本次发布的数据集 VisionScores, VisionScores是一个系统分割的图像评分数据集,旨在为机器学习和深度学习任务提供结构丰富、高信息密度的图像。该数据集专注于双手钢琴作品,考虑了图形相似性和创作模式,因为这些创造性过程高度依赖于乐器。数据集提供了两种场景:第一种由14k个样本组成,考虑来自不同作者但相同创作类型的作品,即Sonatinas;第二种由10.8K个样本组成,呈现相反的情况,来自同一作者的多种创作类型,所选的作曲家是Franz Liszt。所有24.8k个样本都被格式化为128 × 512像素的灰度jpg图像。VisionScores不仅提供了格式化的样本,还提供了系统的顺序和作品的元数据。此外,还包含了未分割的全页评分和预格式化的图像,供进一步分析。VisionScores可在https://github.com/ alroamz/VisionScores免费获取。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)