LAMM: MIT Laboratory for Atomistic and Molecular Mechanics 本次发布的数据集 protein_secondary_structure_from_PDB, 该数据集包含125,955个蛋白质序列,每个序列包含蛋白质的PDB ID、长度、序列(初级结构)以及通过实验识别的二级结构。数据集还包括八类二级结构的总体含量,以及每个序列的初级和次级二级结构类型。数据集用于训练模型,以基于序列预测蛋白质的二级结构含量。此外,数据集还展示了蛋白质设计示例,展示了点突变对α-螺旋和β-折叠含量的系统性影响。
查看protein_secondary_structure_from_PDB
Dataset card 内容:
Files and versions 内容:
关于 LAMM: MIT Laboratory for Atomistic and Molecular Mechanics , LAMM(MIT Laboratory for Atomistic and Molecular Mechanics)是麻省理工学院(MIT)的研究实验室,专注于原子和分子力学的研究,旨在通过模拟和实验来理解和控制物质的微观结构和性质。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)