Yale NLP Lab 本次发布的数据集 ReIFE, ReIFE数据集包含了我们工作Re-evaluating Instruction-Following Evaluation的评估结果集合。它包含两个子集:src和predictions。src子集包含用于评估大型语言模型(LLM)评估器的源数据集。predictions子集包含LLM评估器的评估结果。源数据集来自之前的研究,如LLMBar、MTBench和InstruSum。predictions子集包含450个LLM评估器的评估结果,包括25个基础LLM和18个评估协议。评估结果以JSONL格式存储,每行是一个JSON对象,包含一个LLM评估器在一个数据集上的评估结果。
Dataset card 内容:
Files and versions 内容:
关于 Yale NLP Lab , Yale NLP Lab是耶鲁大学的一个自然语言处理实验室,专注于研究和发展自然语言处理技术,致力于推动该领域的前沿研究与应用。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)