five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

flammen.ai发布Phoenix-SFT-v1数据集,应用在对话记忆提取、结构化记忆分类领域

五号数据雷达开源数据市场2026-05-10 08:2610
Phoenix-SFT-v1是flammen.ai发布的数据集,于2026-05-09首发在HuggingFace应用于对话记忆提取、结构化记忆分类领域

flammen.ai本次发布的数据集Phoenix-SFT-v1,Phoenix v1 是一个用于记忆提取的合成监督微调(SFT)数据集,旨在训练Phoenix模型从用户与AI角色(“Flame”)的聊天记录中提取结构化记忆。数据集包含多种语言的对话,但记忆输出始终为英语。输入为对话记录,输出为包含记忆内容的JSON对象,记忆分为事实、偏好、关系、事件和情感等类别。数据集格式遵循OpenAI/HuggingFace的消息约定,包含训练集和评估集,按密度、语言和阶段分层。数据生成经过三个阶段,包括种子生成、选择提取和质量判断,确保提取的记忆符合11种失败模式的过滤标准。数据集的主要局限性包括仅适用于SFT、完全合成、无日期感知能力、英语输出偏见以及质量判断可能的不完美。

查看Phoenix-SFT-v1

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们