five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

基因泰克 发布 MOLCAP-ARENA 数据集, 应用在 分子属性预测、计算药物发现 领域

五号数据雷达开源数据市场2024-11-06 15:3272
MOLCAP-ARENA 是 基因泰克 发布的数据集,于 2024-11-02 首发在 arXiv 应用于 分子属性预测、计算药物发现 领域

基因泰克 本次发布的数据集 MOLCAP-ARENA, MOLCAP-ARENA是由基因泰克公司创建的一个全面的大规模分子描述数据集,旨在通过语言增强的分子属性预测任务中提供基准测试。该数据集包含了多种分子描述和属性预测任务,如毒性、生物活性等。数据集的创建过程结合了图神经网络(GNN)和生物链接BERT模型(bioLinkBERT-base),通过融合分子和文本信息来增强分子表示。MOLCAP-ARENA的应用领域主要集中在计算药物发现中的分子属性预测,旨在提高现有模型的性能和解释性。

查看MOLCAP-ARENA

README 内容: 

 

关于 基因泰克 , 基因泰克(Genentech)是一家位于美国的生物技术公司,成立于1976年,主要从事生物制药的研发和生产。该公司在癌症治疗、免疫学和眼科疾病等领域有显著的研究成果,是全球生物技术行业的领导者之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们