five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

MonsterAPI 发布 code_search_net 数据集, 应用在 代码搜索、编程分析 领域

五号数据雷达开源数据市场2024-12-13 08:1824
code_search_net 是 MonsterAPI 发布的数据集,于 2024-08-14 首发在 HuggingFace 应用于 代码搜索、编程分析 领域

MonsterAPI 本次发布的数据集 code_search_net, 该数据集包含多个与代码相关的特征,如仓库名称、函数路径、函数名称、完整函数字符串、编程语言、函数代码字符串、函数代码令牌、函数文档字符串、函数文档令牌、分割名称和函数代码URL。数据集分为训练、测试和验证三个部分,分别包含1880853、100529和89154个示例。数据集的总大小为6433783930字节,下载大小为1984438971字节。此外,数据集已被加载并转换为parquet格式,方便使用。

查看code_search_net

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 MonsterAPI , MonsterAPI是一个提供高级API服务的组织,专注于数据处理和分析。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们