丝桥知律(重庆)信息技术有限责任公司本次登记的数据知识产权东南亚各国知识产权法律中英双语结构化对照数据集(向量库),原文件采用 Excel (.xlsx) 二维表结构存储,字段共包含法律名称(文本型)、法律编号、项序、法条原文(文本型)、法条中文翻译(文本型)、创建时间、更新时间、删除时间共8个字段,以法律名称/法律编号+项序为联合主键,更新时间、删除时间可为空,共4173条记录;vector_index.faiss是核心的FAISS 向量索引文件,embeddings.npy是原始的NumPy 二进制文件、向量嵌入数据文件,存储了所有法律条文的TF-IDF向量表示。metadata.json存储了与向量对应的元数据,包含法律条文的详细信息(如法律名称、原文、中文翻译等),当查询返回向量索引时,系统会通过这个文件获取对应的法律条文信息。 tfidf_vectorizer.joblib是TF-IDF向量器,用于将新的查询文本转换为与向量库中向量格式一致的向量表示。
查看东南亚各国知识产权法律中英双语结构化对照数据集(向量库)
关于丝桥知律(重庆)信息技术有限责任公司,-
关于上海市数据产品知识产权管理平台,中国数据知识产权登记平台,提供数据知识产权登记服务。





_1769672084863.jpg)