five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

北邮联合产学研团队发布ONOTE多模态音乐基准数据集 填补音乐AI跨模态评测空白

五号数据雷达开源数据市场2026-04-24 04:5814
北京邮电大学联合中国音乐学院、南洋理工大学于2026年4月23日在国际学术预印本平台arXiv首发多模态音乐符号处理基准数据集ONOTE,该数据集覆盖三类主流乐谱体系,为音乐AI模型评测提供了统一客观标准,将支撑音乐信息检索、智能作曲等多场景应用落地。

随着AIGC技术向垂直文化领域快速渗透,音乐AI近年来成为数字创意产业的热门赛道,智能作曲、智能识谱、音乐转录等创新应用快速落地,但行业长期缺乏标准化的多模态音乐符号基准数据集,现有训练数据普遍存在跨模态对齐度低、符号体系覆盖不全、对非五线谱类乐谱存在偏见等问题,直接制约了音乐AI模型的泛化能力与商业化落地效果。2026年4月23日,北京邮电大学联合中国音乐学院、南洋理工大学共同构建的多模态音乐符号处理基准数据集ONOTE正式首发于国际学术预印本平台arXiv,瞄准上述行业痛点提出了标准化解决方案。

据公开信息显示,ONOTE共包含1120条经过专业校验的高质量样本,完整覆盖标准五线谱、简谱和吉他指法谱三类国内主流乐谱体系,原始数据均来自MusiXQA、GuitarSet等全球公认的专业音乐数据库,研发团队通过规范化音高投影、序列对齐等技术完成了多轮跨模态清洗与对齐处理,解决了不同乐谱体系之间的符号映射误差问题,为各类音乐AI模型的效果评估提供了中立、统一的评测标尺。

作为行业首个同时覆盖三类主流乐谱的多模态基准数据集,ONOTE可广泛应用于视觉乐谱理解、跨格式乐谱转换、音频转乐谱转录、音乐符号生成等核心任务的模型训练与效果验证。从落地场景来看,该数据集可支撑音乐教育领域的智能识谱工具优化,实现不同类型手写、印刷乐谱的精准识别与实时纠错;可辅助智能作曲工具提升多格式乐谱导出能力,降低不同乐器演奏者的协作门槛;还可助力传统音乐文化数字化保护,实现海量纸质简谱、民间乐谱的批量转录与结构化入库;在音乐信息检索场景下,也能支撑“以谱搜曲”“旋律相似度检索”等创新功能的落地。

此次ONOTE数据集的发布,是计算机科学与音乐艺术跨学科融合的典型成果,填补了我国多模态音乐符号处理领域的基准数据空白,对降低音乐AI研发门槛、推动音乐产业数字化转型、完善文化领域数据要素供给体系均具有重要意义。

查看ONOTE

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们