five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

同济大学 发布 M3-20M 数据集, 应用在 药物设计、分子数据 领域

五号数据雷达开源数据市场2024-12-12 07:2229
M3-20M 是 同济大学 发布的数据集,于 2024-12-08 首发在 arXiv 应用于 药物设计、分子数据 领域

同济大学 本次发布的数据集 M3-20M, M3-20M是由同济大学和复旦大学联合创建的一个大规模多模态分子数据集,包含超过2000万种分子。该数据集整合了一维SMILES、二维分子图、三维分子结构、理化性质和文本描述,旨在支持AI驱动的药物设计和发现。数据集通过网络爬虫和GPT-3.5生成文本描述,提供了前所未有的数据规模和多样性。M3-20M的创建过程包括从PubChem、ZINC和QM9数据库中收集分子数据,并进行多模态处理。该数据集主要应用于药物设计、分子生成、分子性质预测等领域,旨在提升AI模型在药物发现中的性能。

查看M3-20M

README 内容: 

 

关于 同济大学 , 同济大学是中国的一所著名综合性大学,位于上海市,以工科见长,尤其在土木工程、建筑学和环境科学等领域享有盛誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们