Bitext Innovation International 本次发布的数据集 Travel QA Pairs for LLM Conversational Fine-Tuning, 该数据集旨在用于微调大型语言模型(如GPT、Mistral和OpenELM),特别针对旅游领域。数据集包含31658个问答对,涵盖33个意图和11个类别,涉及行李、登机牌、取消费用、值机、联系、航班、价格、退款、座位、时间和行程等多个旅游相关主题。每个条目包括标签、用户指令、类别、意图和虚拟助手响应等字段。数据集还包含72种实体类型和10种语言生成标签,以增强模型在不同语言风格和客户交互中的适应性。该数据集基于社区数据许可协议(CDLA)共享1.0版发布,支持广泛的数据共享和协作。
查看Travel QA Pairs for LLM Conversational Fine-Tuning
数据集详情页内容:
关于 Bitext Innovation International , Bitext Innovation International 是一家专注于自然语言处理(NLP)和人工智能技术的公司,提供多语言文本分析和语义理解解决方案。该公司致力于帮助企业通过先进的NLP技术提升客户服务和市场分析的效率。
关于 Databricks , Databricks 数据市场是一个开放的数据市场,旨在跨云、区域和平台无缝共享数据和协作。它允许数据提供者和消费者交换包括数据集、notebooks、应用程序、解决方案加速器和人工智能模型在内的数据资产,且无需依赖特定平台。通过预构建的notebooks和示例数据,消费者能够更快速、高效地评估数据产品。





_1769672084863.jpg)