谷歌研究 本次发布的数据集 FRMT, FRMT是一个针对少样本区域感知机器翻译的新数据集和评估基准,包含从英语到葡萄牙语和普通话的两种区域变体的专业翻译。数据集选择源文档以支持对感兴趣现象的详细分析,包括词汇上不同的术语和干扰术语。该数据集旨在评估少样本区域感知翻译的质量,覆盖了葡萄牙语的巴西和葡萄牙两个区域,以及普通话的大陆和台湾两个区域。通过专业的人工翻译和质量验证,FRMT旨在捕捉区域特定的语言差异,并提供一个测试平台,以探索少样本属性控制。
关于 谷歌研究 , 谷歌研究是谷歌公司旗下的研究部门,致力于推动计算机科学和相关领域的创新,涵盖人工智能、机器学习、数据分析等多个前沿领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)