five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

巴塞罗那超级计算中心(BSC-CNS) 发布 Aloe Beta 数据集, 应用在 医疗信息、人工智能 领域

五号数据雷达开源数据市场2025-05-09 07:3322
Aloe Beta 是 巴塞罗那超级计算中心(BSC-CNS) 发布的数据集,于 2025-05-07 首发在 arXiv 应用于 医疗信息、人工智能 领域

巴塞罗那超级计算中心(BSC-CNS) 本次发布的数据集 Aloe Beta, Aloe Beta数据集是巴塞罗那超级计算中心(BSC-CNS)和加泰罗尼亚理工大学(UPC)联合开发的医疗领域大型语言模型(LLM)训练数据集。该数据集包含1.2M条医学数据指令和420K条通过LLM生成的医学数据指令,旨在提高模型在医疗领域的专业知识和响应用户指令的能力。数据集由高质量的医学数据集和通过LLM生成的合成数据组成,旨在解决医疗领域LLM开发中的数据不足问题,并提高模型的安全性和可靠性。

查看Aloe Beta

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 巴塞罗那超级计算中心(BSC-CNS) , 巴塞罗那超级计算中心(BSC-CNS)是西班牙领先的超级计算中心,致力于科学研究和技术发展,特别是在高性能计算领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们