five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

发布 easy-read 数据集, 应用在 文本简化、西班牙语处理 领域

五号数据雷达开源数据市场2025-01-23 06:5021
easy-read 是 发布的数据集,于 2025-01-22 首发在 HuggingFace 应用于 文本简化、西班牙语处理 领域

本次发布的数据集 easy-read, 该数据集是一个平行语料库,包含1,265对句子(截至2025年1月14日),这些句子对是复杂阅读和易读阅读的变体,旨在作为简化文本的基准,使其易于阅读。该数据集的编译目的是简化西班牙语文本,减少有残疾或其他理解困难人群的语言障碍。数据集支持文本简化任务,语言为西班牙语。每个实例包含一个复杂文本的字符串和一个易读版本的字符串。数据字段包括Lectura Compleja(复杂版本)和Lectura Fácil(易读版本)。数据来源包括Plena inclusión和Plena inclusión La Rioja获取的新闻。

查看easy-read

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们