five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LAMM: MIT Laboratory for Atomistic and Molecular Mechanics 发布 protein_secondary_structure_from_PDB 数据集, 应用在 蛋白质结构、机器学习 领域

五号数据雷达开源数据市场2024-12-13 07:1217
protein_secondary_structure_from_PDB 是 LAMM: MIT Laboratory for Atomistic and Molecular Mechanics 发布的数据集,于 2024-07-27 首发在 HuggingFace 应用于 蛋白质结构、机器学习 领域

LAMM: MIT Laboratory for Atomistic and Molecular Mechanics 本次发布的数据集 protein_secondary_structure_from_PDB, 该数据集包含125,955个蛋白质序列,每个序列包含蛋白质的PDB ID、长度、序列(初级结构)以及通过实验识别的二级结构。数据集还包括八类二级结构的总体含量,以及每个序列的初级和次级二级结构类型。数据集用于训练模型,以基于序列预测蛋白质的二级结构含量。此外,数据集还展示了蛋白质设计示例,展示了点突变对α-螺旋和β-折叠含量的系统性影响。

查看protein_secondary_structure_from_PDB

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 LAMM: MIT Laboratory for Atomistic and Molecular Mechanics , LAMM(MIT Laboratory for Atomistic and Molecular Mechanics)是麻省理工学院(MIT)的研究实验室,专注于原子和分子力学的研究,旨在通过模拟和实验来理解和控制物质的微观结构和性质。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们