马里兰大学帕克分校 本次发布的数据集 VERBOSITYCTRL, VERBOSITYCTRL数据集是一个结合了会话和传统NLP风格的对话数据集,旨在评估CIE在控制文本生成响应长度方面的有效性。该数据集由MSMarco, OpenAssistant 1/2和Databricks Dolly 15k等多个数据集组成,并进行了扩展,以确保训练数据中响应长度的均匀分布。该数据集被分为训练集和验证集,并用于训练和评估CIE方法。
README 内容:
关于 马里兰大学帕克分校 , 马里兰大学帕克分校是美国马里兰州的一所公立研究型大学,也是马里兰大学系统中的旗舰大学,以其在科学、工程、公共卫生等领域的优秀研究和教学质量而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)