ZJUNLP本次发布的数据集PredictBeforeExecute,该数据集是研究“数据为中心的解决方案偏好”项目的一部分,旨在通过数据分析和LLM推理,预测机器学习解决方案在执行前的性能表现。数据集包含完整的解决方案语料库、实验子集、代理运行输出、分析工件和任务资源。主要目录包括:solutions_all/(完整解决方案语料库)、solutions_subset_50/(主实验子集,每任务50个解决方案)、solutions_subset_15/(分析子集,每任务15个解决方案)、agent_runs/(代理执行输出)、analysis_exp/(分析实验工件)、tasks/(任务资源中心)和docker_images/(缓存的Docker镜像)。每个任务文件夹包含annotation/、code/、ground_truth/、output/和report/子目录,分别存储语义标签、可运行解决方案、地面真实数据、运行时日志和评分报告。数据集适用于机器学习解决方案性能预测和相关分析任务。
关于ZJUNLP,ZJUNLP是浙江大学的研究小组,专注于知识图谱和自然语言处理技术的研究。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)