LY株式会社 本次发布的数据集 DnR-nonverbal, DnR-nonverbal是由LY株式会社开发的电影音频源分离专项数据集,聚焦非语言声音的建模挑战。该数据集包含约150条60秒长度的多轨音频,语音干融合阅读式语音与笑声、尖叫等非语言声音,音乐与效果干沿用DnR-v2的FSD50K和FMA资源,总时长约2.5小时。其构建采用零截断泊松分布控制语音片段数量,通过基于规则与大语言模型的过滤机制从FSD50K和FreeSound平台精选素材,确保声音质量的纯净性与多样性。本数据集旨在解决传统模型对情感化语音的错误分离问题,推动电影音频修复、内容分析与版权检测等实际应用的发展。
关于 LY株式会社 , LY株式会社是一家专注于高新技术研发的公司,其业务范围涵盖多个领域,包括信息技术、生物技术、新能源技术等。公司致力于推动科技进步,并通过创新的产品和服务为社会做出贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)