本次发布的数据集 reddit_dataset_118, Bittensor Subnet 13 Reddit Dataset是Bittensor Subnet 13去中心化网络的一部分,包含预处理的Reddit数据,数据由网络矿工持续更新,提供实时的Reddit内容流,适用于各种分析和机器学习任务。数据集支持多种任务,如情感分析、主题建模、社区分析和内容分类。数据集主要语言为英语,但也可能包含多语言内容。数据集结构包括每个Reddit帖子或评论的实例,包含文本、标签、数据类型、社区名称、日期时间、编码的用户名和编码的URL等字段。数据集没有固定的分割,用户需要根据需求和时间戳创建自己的分割。数据来源于Reddit的公开帖子和评论,遵循平台的服务条款和API使用指南。所有用户名和URL都经过编码以保护用户隐私,数据集不包含个人或敏感信息。使用该数据集时应注意Reddit数据中可能存在的偏见和局限性,如数据质量、噪声、时间偏见等。数据集采用MIT许可证发布,使用时还需遵守Reddit的使用条款。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)