five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

AISE research lab at TU Delft 发布 the-heap 数据集, 应用在 Java代码分析、代码仓库管理 领域

五号数据雷达开源数据市场2025-01-18 07:4023
the-heap 是 AISE research lab at TU Delft 发布的数据集,于 2025-01-17 首发在 HuggingFace 应用于 Java代码分析、代码仓库管理 领域

AISE research lab at TU Delft 本次发布的数据集 the-heap, 该数据集主要包含Java代码文件的相关信息,涵盖了文件的基本信息(如文件名、路径、大小、语言、扩展名等)、内容信息(如文件内容、行数、行长度、字母数字比例等)以及仓库信息(如仓库名称、星标数、分支数、开放问题数、许可证等)。此外,数据集还包含了一些重复性检测的字段,用于标识文件是否与其他数据集中的文件重复。数据集的分割信息显示,训练集的大小为31844004999字节,包含5168193个样本。

查看the-heap

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 AISE research lab at TU Delft , AISE research lab at TU Delft是荷兰代尔夫特理工大学的一个研究实验室,专注于开发和应用机器学习模型于软件工程领域。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们