本次发布的数据集 medqa_backtracks_maxpav, 该数据集包含多个字段,涉及提示(prompt)、原始解决方案(original_solution)、原始步骤(original_steps)、原始正确性(original_correct)、值(values)、优势(advantage)、回溯选择(backtrack_choice)、最小优势索引(argmin_advantage)、最小值索引(argmin_value)、最小PAV索引(argmin_pav)、最大优势索引(argmax_advantage)、最大值索引(argmax_value)、最大PAV索引(argmax_pav)、最小索引(argmin)、PAV序列(pav)、新解决方案(new_solution)、新正确性(new_correct)、当前响应(response_so_far)、最佳响应(best_response)、当前令牌数(curr_tokens)、总令牌数(total_tokens)、ID(id)、URL(url)、目标答案(target_answer)、更新(update)、数据索引(data_index)和轮次(turn)。数据集主要用于训练,包含924个样本,总大小为5717711字节。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)