苏黎世应用科技大学 本次发布的数据集 SM3-Text-to-Query, SM3-Text-to-Query是一个基于合成患者数据的多模型医疗文本到查询基准数据集,由苏黎世应用科技大学创建。该数据集包含10,000条自然语言问题与查询对,涵盖关系数据库(PostgreSQL)、文档存储(MongoDB)和图数据库(Neo4j和GraphDB)四种查询语言(SQL、MQL、Cypher和SPARQL)。数据集通过Synthea生成,遵循SNOMED-CT分类法,确保数据的标准化和隐私保护。创建过程包括系统化的问题模板开发和数据增强,旨在评估不同数据库模型和查询语言在文本到查询系统中的性能,适用于医疗领域的数据查询和分析。
关于 苏黎世应用科技大学 , 苏黎世应用科技大学(ZHAW)是瑞士最大的应用科学大学之一,提供广泛的本科和研究生课程,涵盖工程、健康、社会科学和设计等多个领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)