five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

德克萨斯大学圣安东尼奥分校 发布 ShIOEnv-40c 数据集, 应用在 命令行界面、代码生成 领域

五号数据雷达开源数据市场2025-05-28 18:3017
ShIOEnv-40c 是 德克萨斯大学圣安东尼奥分校 发布的数据集,于 2025-05-24 首发在 arXiv 应用于 命令行界面、代码生成 领域

德克萨斯大学圣安东尼奥分校 本次发布的数据集 ShIOEnv-40c, ShIOEnv-40c数据集由德克萨斯大学圣安东尼奥分校创建,旨在为命令行界面(CLI)行为建模提供丰富多样的数据。数据集包含71,000条Bash输入输出行为,涉及40个命令,由六种策略和NL2Bash基线生成。该数据集的特点是提供了详尽的执行行为日志,能够系统地收集命令执行行为。ShIOEnv环境用于评估候选命令参数组合,以识别哪些行为已经代表,哪些引入了新的模式,从而指导数据集中代表性样本的选择。通过使用语法约束和策略优化,数据集在保证语法有效性的同时,最小化了参数冗余,提高了数据集的质量。ShIOEnv-40c数据集可用于代码生成模型CodeT5的微调,从而提高模型的模拟精度。

查看ShIOEnv-40c

关于 德克萨斯大学圣安东尼奥分校 , 德克萨斯大学圣安东尼奥分校(UTSA)是美国德克萨斯州圣安东尼奥市的一所公立研究型大学,成立于1969年。该校提供广泛的本科、研究生和博士课程,涵盖科学、工程、商业、教育、艺术等多个领域。UTSA在计算机科学、工程学和商学等领域具有较强的研究实力,致力于推动创新和跨学科研究。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们