MonsterAPI 本次发布的数据集 code_search_net, 该数据集包含多个与代码相关的特征,如仓库名称、函数路径、函数名称、完整函数字符串、编程语言、函数代码字符串、函数代码令牌、函数文档字符串、函数文档令牌、分割名称和函数代码URL。数据集分为训练、测试和验证三个部分,分别包含1880853、100529和89154个示例。数据集的总大小为6433783930字节,下载大小为1984438971字节。此外,数据集已被加载并转换为parquet格式,方便使用。
Dataset card 内容:
Files and versions 内容:
关于 MonsterAPI , MonsterAPI是一个提供高级API服务的组织,专注于数据处理和分析。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)