印度理工学院孟买分校 本次发布的数据集 m-CHA, m-CHA数据集是由印度理工学院孟买分校的研究团队手工收集的,包含了866个催化meta-C(sp2)-H键激活反应,这些反应源自26篇同行评审的论文。数据集中的反应在底物、偶联伙伴、催化剂、配体、氧化剂、碱和溶剂等方面有所不同。该数据集通过将反应物分子的SMILES字符串连接起来,形成一个适合机器学习模型构建的复合表示。该数据集的应用领域在于优化化学反应的收益率,解决化学反应中的催化剂、反应条件、底物选择等问题。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)