本次发布的数据集dev-TIR_v3,该数据集包含与问题解决任务相关的特征,包括问题陈述、解决方案以及关于解决方案尝试的各种元数据。数据集包含诸如problem(问题)、solution(解决方案)、tir_attempts(尝试次数)、fallback_used(是否使用备用方案)、tir_status(状态)、llm-code(LLM生成的代码)、raw_generation(LLM的原始输出,包括推理部分和最终代码)、output(格式化后的可读输出)、execution_output(执行输出)、generated_solution(生成的解决方案)和expected_answer(预期答案)等字段。raw_generation字段是SFT(监督微调)的学习目标,而output字段仅用于可读性展示,不用于训练。数据集包含一个train(训练)分割,共100个示例。
Dataset card内容:
Files and versions内容:
关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)