加利福尼亚大学洛杉矶分校 本次发布的数据集 DialectGen, DialectGen是一个大规模的多方言基准数据集,用于评估在图像和视频生成中的方言鲁棒性。该数据集包含六个常见的英语方言,包括标准美式英语、英式英语、奇卡诺英语、印度英语和新加坡英语。为了确保数据集的质量,研究人员与方言发言人合作,收集并验证了超过4200个独特的提示语,并通过严格的特征选择和提示语过滤流程确保了提示语的质量。DialectGen数据集旨在解决多模态生成模型在处理方言文本输入时的性能下降问题,并为提高方言鲁棒性提供了重要的数据资源。
关于 加利福尼亚大学洛杉矶分校 , 加利福尼亚大学洛杉矶分校(UCLA)是美国著名的公立研究型大学,位于洛杉矶市。它是加利福尼亚大学系统中的第二古老的分校,以其卓越的学术研究和教学质量而闻名。UCLA在多个学科领域,如工程、医学、法律和艺术等,均享有极高的声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)