Gleghorn Lab本次发布的数据集OmniPath_2class,该数据集包含生物序列相互作用的相关信息,主要用于研究序列间的相互作用及其共识特征。数据集包含以下字段:IdA和IdB(字符串类型,表示相互作用的两个实体的标识符)、labels(整型,表示相互作用的标签)、consensus_stim、consensus_inhib和consesus_direction(布尔型,表示相互作用的共识特征)、sources(字符串类型,表示数据来源)、type(字符串类型,表示数据类型)、references_stripped(字符串类型,表示参考文献信息)、SeqA和SeqB(字符串类型,表示相互作用的两个序列)。数据集包含一个训练集(train),共有349,570个样本,总大小为488,609,232字节,下载大小为443,731,302字节。
Dataset card内容:
Files and versions内容:
关于Gleghorn Lab,Gleghorn Lab是一个专注于计算机科学和人工智能领域研究的实验室,致力于推动技术创新和突破,在机器学习、数据分析和智能系统等方向拥有深厚的研究实力和丰富的项目经验。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)