杭州叙简科技股份有限公司 本次登记的数据知识产权 安全生产知识能力评估训练数据, 通过对安全生产领域知识测评数据,进行上下文标注,形成具有高度针对性和语义复杂性的训练集。这些数据通过数据解析和安全合规验证,从而生成安全生产领域的专业样本,为全面评估AI大模型的安全生产知识提供了专业全面的测试样例,在安全生产问答题解答中的语义理解能力、语言表达能力和思维推导能力评估,以及测试和提升安全生产领域AI模型对场景理解的适用性。1.数据采集:采集《中华人民共和国安全生产法》《中华人民共和国消防法》《安全事故隐患排查治理暂行规定》《固定式压力容器安全技术监察规程》《起重机械定期检验规则》等安全生产相关法律法规、规章制度涉及的安全生产领域公开测试、考试题目,得到待分析原始数据的安全生产类文献题目数据集。 2.数据处理:1)采用文本标注,标注题目所属安全类型;2)采用TextRank提取摘要的方式提取每个段落的一个关键句,将关键句按照段落的顺序排列,组成新的文本内容;对文本内容提取出的关键句序列再进行一轮关键句提取,根据迭代传播权重计算各个句子的得分,再将每个句子输入序列标注模型,得到实体序列标注结果,包含实体越多的句子给予越高的重要度权重倾斜,实体权重得分和句子重要度得分之和即作为每个句子最终的重要度分数。每次设置一个范围在[1,4]的整型随机数r,提取排名前r的关键句作为该题的正确候选答案(即在TextRank模型中,T=r),将正确候选答案分类存储;3)根据该题目的安全类型与正确候选答案的实体类型,在相同安全类型与实体类型的答案集中随机选择字符长度与原正确候选答案最为接近的3个答案成为该题目的错误候选答案,若答案集中符合要求的错误候选答案数量不足,则采用NLTK生成该答案的反义词作为错误候选答案的补充。 3.数据应用:该数据集可用来测试和提升安全生产领域AI模型对场景理解的适用性。
登记内容:
关于 杭州叙简科技股份有限公司 , 杭州叙简科技股份有限公司是一家专注于大数据处理与分析的高新技术企业,致力于为政府和企业提供智慧城市解决方案和技术服务。该公司在数据挖掘、人工智能等领域拥有丰富的技术积累和行业经验。
关于 浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是一个专门用于登记和管理数据知识产权的官方平台。该平台允许企业和个人申请登记其数据知识产权,包括专利分类数据、客户价值评估数据等。平台提供公告功能,展示已登记、放弃或撤销的数据知识产权信息,并提供详细的申请人、申请时间和更新信息。





_1769672084863.jpg)