CFV-NB:基于概念特征向量的NB文档分类模型  

CFV-NB: Nave-Bayes Documents Classification Model Based on Concept Feature Vectors

在线阅读下载全文

作  者:何丽[1] 刘军[2] 

机构地区:[1]天津大学管理学院,天津300072 [2]天津财经大学理工学院,天津300222

出  处:《计算机工程》2006年第20期4-6,共3页Computer Engineering

基  金:天津自然科学基金资助项目(033611011);天津市高等学校科技发展基金资助项目(20041603)

摘  要:提出了一种基于概念特征向量的NB文档分类方法。该方法在未标注文档集上通过SOM(Self-OrganizingMaps)聚类产生若干初始文档类,并为每个文档类分配一个类标签,使用最大信息熵的方法建立每个文档类的概念特征向量。在概念特征向量空间上建立最终的文档分类器:CFB-NB。This paper proposes a novel Na'l've-Bayes document classification method based on the set of concept feature vectors. It produces some initial classes from the set of unlabeled Web documents by SOM clustering and distributes a label for each, and builds the corresponding concept feature vector for each initial class using the maximum entropy method. It builds the last CFV-NB document classifier based on the space of concept feature vectors.

关 键 词:文档分类 概念特征向量 NB分类器 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象