本次发布的数据集 reddit_dataset_12, Bittensor Subnet 13 Reddit数据集是Bittensor Subnet 13去中心化网络的一部分,包含预处理的Reddit数据。数据由网络矿工持续更新,提供实时的Reddit内容流,适用于各种分析和机器学习任务。数据集支持多种任务,如情感分析、主题建模、社区分析和内容分类。数据集主要包含英文内容,但也可能是多语言的。数据集结构包括每个Reddit帖子或评论的实例,包含文本、标签、数据类型、社区名称、日期时间、编码的用户名和编码的URL等字段。数据集没有固定的划分,用户应根据需求创建自己的划分。数据来源于Reddit的公开帖子和评论,遵循平台的服务条款和API使用指南。所有用户名和URL都被编码以保护用户隐私。数据集可能包含社交媒体平台常见的噪音、垃圾信息或无关内容,并且可能存在时间偏差。数据集发布在MIT许可证下,使用还需遵守Reddit的使用条款。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)