广东岭创数字科技有限公司本次登记的数据知识产权岭南文化粤语思维链问答高质量数据集,本数据集是以粤语为载体、以岭南文化为核心构建的高质量问答文本数据集,旨在系统呈现与传承岭南地域文化,并支撑相关大模型的训练与优化。 数据集围绕“表层文化—中层文化—深层文化”三层框架,系统涵盖工艺器物、建筑景观、节庆习俗、饮食文化、语言与价值观等多领域,并通过贴近日常的粤语问答场景展开。每条数据均包含用户问题、思维链推理说明及最终答案,其中思维链清晰呈现知识梳理与表达组织的逻辑路径,有效引导模型进行链式思考与在地化输出。 数据处理严格遵循专业标注流程与质控机制,由具备文化背景与粤语能力的人员完成构造、撰写与多轮复核,确保内容事实准确、表达自然得体、逻辑严谨可追溯,不含个人信息与不当内容。 本数据集主要面向文旅、文博、传媒及公共文化服务等领域,可用于开发粤语智能导览、文化知识问答、互动科普及内容生成等应用。通过近1.1万条高质量样本,能显著提升算法在粤语理解生成、文化知识表达与复杂推理方面的能力,并为算法备案后的评估与迭代提供重要基础资源。
关于广东岭创数字科技有限公司,广东岭创数字科技有限公司是一家专注于数字科技领域的企业,主要业务涵盖大数据分析、人工智能技术研发及数字化解决方案提供。公司致力于为各行业客户提供创新的数字技术服务,推动企业数字化转型。
关于广东省数据知识产权存证登记平台,广东省公共数据授权运营平台,提供公共数据服务。





_1769672084863.jpg)