TCBPL:一种高效文本分类新方法  被引量:2

TCBPL: A New Efficient Method of Text Categorization

在线阅读下载全文

作  者:解本政[1] 

机构地区:[1]山东建筑工程学院管理学院,济南250014

出  处:《计算机工程》2005年第23期6-7,19,共3页Computer Engineering

摘  要:根据模式聚合理论(PA)和隐含语义分析理论(LSA)提出了一种文本分类新方法——TCBPL方法,该方法应用PA理论和LSA理论来构造向量空间模型,大大削减了特征向量的维数,同时增强了稀有词的作用,并在特征向量中引入了语义成分,从而提高了分类的速度和精度。The paper puts forward a new method of text categorization called TCBPL method by PA and LSA. The new method establishes vector space model of term weight by the theory of PA and LSA, which decreases the dimension of vector, and enhances the function of the words from the viewpoint of categorization effect, and then the semantic factor is enhanced. Therefore the new method advances largely the speed and the precision of text categorization.

关 键 词:模式聚合 隐含语义分析 文本分类 向量空间模型 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象