Los Alamos National Laboratory 本次发布的数据集 OpenSMILES Specification Data, 该数据集展示了smirk和smirk-gpe分词器的性能,它们能够完整地表示OpenSMILES规范。同时,smirk分词器的源代码可在GitHub上获取,附带有示例笔记本。该任务的目的是评估分词器在分子建模中的覆盖范围和性能。
查看OpenSMILES Specification Data
关于 Los Alamos National Laboratory , 洛斯阿拉莫斯国家实验室是美国的一个大型多学科研究机构,成立于1943年,最初是为了开发原子弹而设立的。现在,它主要从事核武器研究、能源开发、国家安全、环境科学等领域的研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)