Bruno Kessler基金会 本次发布的数据集 MuST-Cinema, MuST-Cinema是一个多语言语音翻译语料库,由Bruno Kessler基金会创建,包含音频、转录和翻译三元组,特别标注了字幕断点。该数据集解决了现有字幕语料库缺乏源语言音频对齐和字幕断点信息的问题,适用于训练神经机器翻译系统,以自动分割句子为字幕序列。MuST-Cinema的应用领域包括提高字幕翻译的效率和质量,减少人工工作量和相关成本。
关于 Bruno Kessler基金会 , Bruno Kessler基金会(Fondazione Bruno Kessler,简称FBK)是意大利特伦托的一个研究和创新中心,专注于信息技术、社会科学和人文学科的研究。该基金会成立于1991年,以意大利物理学家Bruno Kessler的名字命名,致力于推动科学和技术的发展,并在多个领域进行前沿研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)