基于语境和语义的中文文本聚类算法研究  

在线阅读下载全文

作  者:吴勇[1] 周军[1] 

机构地区:[1]湖南机电职业技术学院院信息工程系,湖南长沙410151

出  处:《科技信息》2010年第35期I0029-I0030,共2页Science & Technology Information

基  金:湖南省教育厅资助科研项目;项目编号09C1163

摘  要:基于语境和语义的聚类算法,一方面从领域、情景、背景三方面提取特征词,建立语境框架文本特征,另一方面计算关键词TF-IDF权重值,形成关键词VSM向量空间。将两方面得到的特征项分别存储,构造特征空间。分两次聚类,第一次聚类对语境框架文本特征进行聚类,将相同语境的文本归为一类,达到快速聚类的效果。第二次聚类在第一次聚类的基础上,对各语境类内的文本再一次聚类,利用文本关键词向量空间进行语义计算,实现更细致的划分,达到提高聚类精度的目的。

关 键 词:语境 语义 特征提取 VSM 聚类 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象