Bitext Innovation International 本次发布的数据集 Retail Ecommerce QA Pairs for LLM Conversational Fine-Tuning, 该数据集旨在用于微调大型语言模型(如GPT、Mistral和OpenELM),以实现零售(电子商务)领域的垂直化/领域适应。数据集包含44884个问答对,涵盖46个意图和13个类别,适用于意图检测。每个条目包括标签、用户指令、类别、意图和虚拟助手响应等字段。数据集还包含2970种实体/槽类型和10种语言生成标签,以增强模型在零售环境中理解和生成多样化对话的能力。数据集基于Community Data License Agreement (CDLA) Sharing 1.0发布,支持广泛共享和协作。
查看Retail Ecommerce QA Pairs for LLM Conversational Fine-Tuning
数据集详情页内容:
关于 Bitext Innovation International , Bitext Innovation International 是一家专注于自然语言处理(NLP)和人工智能技术的公司,提供多语言文本分析和语义理解解决方案。其产品和服务广泛应用于客户服务、市场分析和内容管理等领域。
关于 Databricks , Databricks 数据市场是一个开放的数据市场,旨在跨云、区域和平台无缝共享数据和协作。它允许数据提供者和消费者交换包括数据集、notebooks、应用程序、解决方案加速器和人工智能模型在内的数据资产,且无需依赖特定平台。通过预构建的notebooks和示例数据,消费者能够更快速、高效地评估数据产品。





_1769672084863.jpg)