Mesolitica 本次发布的数据集 MalaysianFeedback, 马来西亚反馈数据集是一个多样化的数据集,用于训练奖励模型,以使模型更具马来西亚特色。数据集从Twitter、Facebook、c.cari.com.my论坛、b.cari.com.my论坛和Lowyat论坛等多个社交媒体平台收集反馈数据。数据集的构建包括指令采样和模型采样两个部分,指令采样通过解析社交媒体问题生成指令数据集,模型采样则选择不同级别的基模型来完成这些指令。
Dataset card 内容:
Files and versions 内容:
关于 Mesolitica , Mesolitica 是东南亚人工智能领域的开发者,专注于聊天机器人、语音技术以及先进的多语言语言模型。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)