Siguiente 本次发布的数据集 orpo-es-v0.0.2, 该数据集包含三种配置:default、mistral_tokenized和mistral_training。default配置包含prompt、chosen和rejected特征,其中chosen和rejected是列表,包含content和role字段。mistral_tokenized配置包含chosen、rejected和prompt特征。mistral_training配置包含input_ids、labels和attention_mask特征,这些特征都是序列类型。数据集支持西班牙语,包含训练和测试集,大小在1K到10K之间。
Dataset card 内容:
Files and versions 内容:
关于 Siguiente , Siguiente是一个致力于推动自由软件、开源软件和数字化自由的非营利组织,旨在通过技术支持、教育推广和社区建设,促进开源文化和技术在全球范围内的传播和应用。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)