SWAP Research Group@UNIBA 本次发布的数据集 il_calderone, 该数据集是[The Cauldron](https://huggingface.co/datasets/HuggingFaceM4/the_cauldron)的机器翻译版本,专门为意大利语设计。原始数据集包含50个任务,但只有15个任务在机器翻译后仍保持其意义,因此被保留。在这15个任务中,选择了前10,000行进行机器翻译,未正确翻译的问答对被丢弃。图像路径的格式化策略如下:task-name/images/row_number_image_number,其中task-name是原始数据集中的任务名称,row_number是原始数据集中的行号,image_number是图像的索引(在有多个图像作为输入的任务中)。
Dataset card 内容:
Files and versions 内容:
关于 SWAP Research Group@UNIBA , SWAP Research Group@UNIBA是隶属于巴勒莫大学(University of Bari)的研究团队,专注于软件工程、程序分析和网页开发等领域的先进技术研究。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)