东京大学 本次发布的数据集 Impression Caption Dataset for Environmental Sounds, Impression Caption Dataset for Environmental Sounds是由东京大学和立命馆大学等机构创建的一个用于描述环境声音印象的数据集。该数据集包含3600条印象描述,每条描述对应一个环境声音,旨在捕捉人类在听到这些声音时的情感反应。数据集的创建过程包括通过众包服务收集印象词汇,使用ChatGPT生成印象描述,并通过人工筛选最合适的描述。该数据集主要应用于媒体内容制作中的环境声音推荐和自动生成,旨在提升音频字幕的表现力和理解度。
查看Impression Caption Dataset for Environmental Sounds
关于 东京大学 , 东京大学是日本最顶尖的国立大学之一,位于日本东京,以其卓越的教育和研究成果闻名于世。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)