five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

SWAP Research Group@UNIBA 发布 il_calderone 数据集, 应用在 机器翻译、意大利语 领域

五号数据雷达开源数据市场2024-12-13 05:0029
il_calderone 是 SWAP Research Group@UNIBA 发布的数据集,于 2024-11-27 首发在 HuggingFace 应用于 机器翻译、意大利语 领域

SWAP Research Group@UNIBA 本次发布的数据集 il_calderone, 该数据集是[The Cauldron](https://huggingface.co/datasets/HuggingFaceM4/the_cauldron)的机器翻译版本,专门为意大利语设计。原始数据集包含50个任务,但只有15个任务在机器翻译后仍保持其意义,因此被保留。在这15个任务中,选择了前10,000行进行机器翻译,未正确翻译的问答对被丢弃。图像路径的格式化策略如下:task-name/images/row_number_image_number,其中task-name是原始数据集中的任务名称,row_number是原始数据集中的行号,image_number是图像的索引(在有多个图像作为输入的任务中)。

查看il_calderone

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 SWAP Research Group@UNIBA , SWAP Research Group@UNIBA是隶属于巴勒莫大学(University of Bari)的研究团队,专注于软件工程、程序分析和网页开发等领域的先进技术研究。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们