Google DeepMind 本次发布的数据集 Simple reversals, Simple syllogisms, Reversal curse paper, Semantic structure benchmark, 本文提出了一系列数据集,旨在研究语言模型在上下文学习和微调中的泛化能力。这些数据集包括简单逆转、简单三段论、逆转诅咒论文和语义结构基准。它们被设计为隔离数据集中的知识,以创建清洁的泛化测试。这些数据集通过让预训练的大型模型接触数据集中的控制子集信息,并在需要各种泛化类型的测试集上评估其性能。研究结果表明,在数据匹配的情况下,上下文学习比微调更加灵活。此外,本文还提出了一种通过添加上下文推理来改进微调泛化的方法。
查看Simple reversals, Simple syllogisms, Reversal curse paper, Semantic structure benchmark
关于 Google DeepMind , Google DeepMind 是一家位于英国的人工智能公司,专注于研究机器学习和神经网络,旨在解决人工智能领域的难题,并推动相关技术的发展。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)