检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南城市学院
出 处:《电脑知识与技术》2019年第9Z期27-28,共2页Computer Knowledge and Technology
基 金:湖南省教育厅科学研究项目(16C0300)
摘 要:传统的中文文本聚类方法需要将半结构化或非结构化的数据构建数学模型,一般情况下都要进行降维处理,这些操作均会带来一定失真,影响聚类的准确性和效果。该文以待聚类文本为研究对象,以文本特征词为属性,引入形式概念分析理论,采用概念格聚类的方式对中文文本进行聚类,同时,将特征词匹配至可变属性粒度的属性树上,避免因为属性粒度过细导致聚类速度慢的问题,该算法聚类效果良好。
关 键 词:中文文本聚类 形式概念分析 概念格 可变粒度 特征词
分 类 号:TP319[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117