five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据产品上架 / 正文

多语种对中文文本数据集已成功在合肥数据要素流通平台进行上架,应用在机器翻译、多语种领域

五号数据雷达数据产品上架2024-12-24 01:0430
多语种对中文文本数据集 是 合肥易联语数科技有限公司 上架的数据产品,于 2024-12-05 首发在 合肥数据要素流通平台

合肥易联语数科技有限公司 本次上架的数据产品 多语种对中文文本数据集, 数据为五十多种语言对中文的双语句对。涵盖多语种(阿尔巴尼亚语、阿拉伯语、阿塞拜疆语、爱沙尼亚语、巴斯克语、白俄罗斯语、保加利亚语、冰岛语、波兰语、波斯尼亚波斯语、藏语、丹麦语、德语、俄语、法语、菲律宾语、芬兰语、高棉语、古吉拉特语、哈萨克语-西里尔、哈萨克语、韩语、荷兰语、吉尔吉斯语、加利西亚语、加泰罗尼亚语、克罗地亚语、拉丁语、拉脱维亚语、老挝语、立陶宛语、罗马尼亚语、马拉地语、马来语、马其顿语、蒙古语、蒙古语-西里尔、孟加拉语、缅甸语、尼泊尔语、挪威语、葡萄牙语、普什图语、日语、瑞典语、塞尔维亚语-拉丁、僧伽罗语、斯洛伐克语、斯瓦希里语、塔吉克语、泰卢固语 、泰米尔语、泰语、土耳其语、土库曼语、维吾尔语、乌尔都语、乌克兰语、乌兹别克语、西班牙语、匈牙利语、意大利语 、印地语、印尼语、越南语、粤语)对中文双语数据; 通过双语语料提升机器翻译引擎的用户使用; 可以根据您的需求定制数据。

查看多语种对中文文本数据集

上架内容: 

 

关于 合肥易联语数科技有限公司 , 合肥易联语数科技有限公司是一家专注于技术服务、技术开发、咨询交流及技术推广的公司,同时也致力于人工智能公共数据平台的构建,提供翻译服务、软件外包与开发、数据处理和存储支持,以及大数据服务。2023年8月和9月,该公司的两款数据产品——“多语种多领域双语句对”和“汉语-英语平行语料”,相继在合肥数据要素流通平台挂牌,这标志着该公司在多语种数据处理和语料库建设方面取得了显著成果,展现了其数据集的广泛覆盖和深入分类特点。

关于 合肥数据要素流通平台 , 该平台旨在推动数据要素市场供给侧改革,增加公共数据和社会数据的有效供给,汇聚大数据产业全链条服务商。该平台聚焦人工智能、工业互联网、金融、科研等4大应用场景,提供数据集、API、数据服务、解决方案等多元化产品,以及数据定制、数据标注、数据治理、算法建模等增值服务。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们