本次发布的数据集 medqa_backtracks_pav, 该数据集包含多个字段,主要涉及问题提示(prompt)、原始解决方案(original_solution)、原始步骤(original_steps)、原始解决方案的正确性(original_correct)、数值序列(values)、优势序列(advantage)、回溯选择(backtrack_choice)、最小优势索引(argmin_advantage)、最小值索引(argmin_value)、最小PAV索引(argmin_pav)、最大优势索引(argmax_advantage)、最大值索引(argmax_value)、最大PAV索引(argmax_pav)、最小索引(argmin)、PAV序列(pav)、新解决方案(new_solution)、新解决方案的正确性(new_correct)、当前响应(response_so_far)、最佳响应(best_response)、当前令牌数(curr_tokens)、总令牌数(total_tokens)、ID(id)、URL(url)、目标答案(target_answer)、更新状态(update)、数据索引(data_index)和轮次(turn)。数据集分为训练集(train),包含959个样本,文件大小为5407648字节。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)