塔夫斯公司本次发布的数据集SlideRL,SlideRL是由塔夫斯公司、德克萨斯大学达拉斯分校和德克萨斯农工大学联合构建的开源数据集,包含288条多轮次轨迹数据,覆盖6种大型语言模型在48个商业演示任务中的完整生成过程。该数据集记录了每轮工具调用、环境观察、步骤奖励和质量评分,旨在支持智能体在幻灯片自动生成任务中的强化学习研究。数据通过Claude Opus 4.6生成的专家轨迹进行标注,应用于评估模型在内容规划、视觉设计和逆向规范奖励等方面的表现,为复杂创意任务的工具使用与多维度质量评估提供基准。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)