five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 公共数据授权运营 / 正文

无监督词库构建已成功在海南省公共数据授权运营-海南省数据产品超市进行上架,应用在自然语言处理、词汇挖掘领域

五号数据雷达公共数据授权运营2024-10-20 15:2226
无监督词库构建 是 中国电信股份有限公司海南分公司-数据产品超市 上架的数据产品,于 2024-10-20 首发在 海南省公共数据授权运营-海南省数据产品超市

中国电信股份有限公司海南分公司-数据产品超市 本次上架的数据产品 无监督词库构建, 利用基于信息熵和内部凝固度的无监督词库挖掘算法,结合各个场景下模型训练经验,能够实现在大量语料中建模分析出特有词汇,且没有长度的限制,除了2-4字的常用词,还能挖掘出场景化的短语。再与TF-IDF和LDA等算法结合后,能够进一步增加新词识别的可靠度。

查看无监督词库构建

上架内容: 

 

关于 中国电信股份有限公司海南分公司-数据产品超市 , 中国电信股份有限公司海南分公司-数据产品超市是中国电信在海南地区设立的一个专门提供数据产品和服务的平台。该平台致力于为企业客户提供高质量的数据解决方案,涵盖数据分析、数据存储和数据应用等多个领域,助力企业数字化转型。

关于 海南省公共数据授权运营-海南省数据产品超市 , 海南省采用“政府+市场”双轮驱动的公共数据授权运营模式,以促进数据要素的开发和利用。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们