five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据产品上架 / 正文

无监督词库构建已成功在海南省数据产品超市进行上架,应用在自然语言处理、文本挖掘领域

五号数据雷达数据产品上架2024-10-22 10:3020
无监督词库构建 是 中国电信股份有限公司海南分公司-数据产品超市 上架的数据产品,于 2023-12-19 首发在 海南省数据产品超市

中国电信股份有限公司海南分公司-数据产品超市 本次上架的数据产品 无监督词库构建, 利用基于信息熵和内部凝固度的无监督词库挖掘算法,结合各个场景下模型训练经验,能够实现在大量语料中建模分析出特有词汇,且没有长度的限制,除了2-4字的常用词,还能挖掘出场景化的短语。再与TF-IDF和LDA等算法结合后,能够进一步增加新词识别的可靠度。

查看无监督词库构建

上架内容: 

 

关于 中国电信股份有限公司海南分公司-数据产品超市 , 中国电信股份有限公司海南分公司-数据产品超市是中国电信在海南地区设立的数据产品服务平台,专注于为企业客户提供数据产品及解决方案,助力企业数字化转型。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们