基因泰克 本次发布的数据集 MOLCAP-ARENA, MOLCAP-ARENA是由基因泰克公司创建的一个全面的大规模分子描述数据集,旨在通过语言增强的分子属性预测任务中提供基准测试。该数据集包含了多种分子描述和属性预测任务,如毒性、生物活性等。数据集的创建过程结合了图神经网络(GNN)和生物链接BERT模型(bioLinkBERT-base),通过融合分子和文本信息来增强分子表示。MOLCAP-ARENA的应用领域主要集中在计算药物发现中的分子属性预测,旨在提高现有模型的性能和解释性。
README 内容:
关于 基因泰克 , 基因泰克(Genentech)是一家位于美国的生物技术公司,成立于1976年,主要从事生物制药的研发和生产。该公司在癌症治疗、免疫学和眼科疾病等领域有显著的研究成果,是全球生物技术行业的领导者之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)