纽约大学 本次发布的数据集 data-harmonization-benchmark, data-harmonization-benchmark是由纽约大学与生物医学领域专家合作开发的新基准数据集,主要用于模式匹配任务。该数据集包含真实的生物医学数据,旨在解决数据集成和分析中的复杂模式匹配问题。数据集的创建过程结合了小语言模型(SLMs)和大语言模型(LLMs)的优势,通过生成多样化的训练数据和有效的提示策略来提升匹配精度。该数据集的应用领域主要集中在生物医学数据集成,旨在解决数据异构性和模式匹配中的挑战。
查看data-harmonization-benchmark
README 内容:
关于 纽约大学 , 纽约大学(NYU)是一所位于美国纽约市的世界著名私立研究型大学,以其多元化的课程和国际化的校园环境而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)