Hugging Face 本次发布的数据集 community-science-merged, 该数据集包含多个字段,如arxiv_id、reached_out_link、reached_out_success等,涉及到的数据类型包括字符串、浮点数和布尔值。数据集主要用于记录与学术论文相关的信息,包括论文的识别号、外部链接、成功联系的情况、笔记、模型数量、数据集数量、空间数量、标题、GitHub信息、GitHub星数、会议名称、点赞数、评论数、GitHub提及HF的情况、是否有制品、提交者和日期。数据集分为训练集,包含5064个样本,总大小为1127665字节。
Dataset card 内容:
Files and versions 内容:
关于 Hugging Face , Hugging Face是一家专注于自然语言处理和人工智能领域的公司,提供丰富的预训练模型和工具,支持开发者在NLP任务中快速构建和部署高效的解决方案。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)