首页 / 开源数据市场 / 正文

LY株式会社发布 DnR-nonverbal 数据集, 应用在音频源分离、电影音频领域

五号数据雷达开源数据市场2025-11-14 23:3121

DnR-nonverbal 是 LY株式会社发布的数据集,于 2025-06-10 首发在 arXiv 应用于音频源分离、电影音频领域

LY株式会社本次发布的数据集 DnR-nonverbal, DnR-nonverbal是由LY株式会社开发的电影音频源分离专项数据集，聚焦非语言声音的建模挑战。该数据集包含约150条60秒长度的多轨音频，语音干融合阅读式语音与笑声、尖叫等非语言声音，音乐与效果干沿用DnR-v2的FSD50K和FMA资源，总时长约2.5小时。其构建采用零截断泊松分布控制语音片段数量，通过基于规则与大语言模型的过滤机制从FSD50K和FreeSound平台精选素材，确保声音质量的纯净性与多样性。本数据集旨在解决传统模型对情感化语音的错误分离问题，推动电影音频修复、内容分析与版权检测等实际应用的发展。

查看DnR-nonverbal

关于 LY株式会社 , LY株式会社是一家专注于高新技术研发的公司，其业务范围涵盖多个领域，包括信息技术、生物技术、新能源技术等。公司致力于推动科技进步，并通过创新的产品和服务为社会做出贡献。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

LY株式会社 发布 DnR-nonverbal 数据集, 应用在 音频源分离、电影音频 领域

社区讨论

LY株式会社发布 DnR-nonverbal 数据集, 应用在音频源分离、电影音频领域