LAION eV本次发布的数据集nemotron-terminal-scientific_computing-3pct,该数据集是一个结构化对话数据集,包含多个特征字段,用于记录对话内容及相关元数据。主要特征包括对话内容(conversations,包含内容和角色字段)、代理(agent)、模型(model)、模型提供者(model_provider)、日期(date)、任务(task)、情节(episode)、运行ID(run_id)、试验名称(trial_name)、是否启用思考(enable_thinking)、来源(source)和难度(difficulty)。数据集包含一个训练集(train)分片,共计584个样本,总大小为31,221,006字节。适用于对话系统、自然语言处理任务的研究与开发。
查看nemotron-terminal-scientific_computing-3pct





_1769672084863.jpg)