基于交叉覆盖算法的文本分类  被引量:5

Text Classification Based on Cross Cover Algorithm

在线阅读下载全文

作  者:王倩倩[1] 段震[1] 张燕平[1] 

机构地区:[1]安徽大学计算智能与信号处理重点实验室,安徽合肥230039

出  处:《计算机技术与发展》2007年第6期113-115,共3页Computer Technology and Development

基  金:"九七三"计划国家重点基础研究(2004CB318108);国家自然科学基金(60475017;60135010);安徽省自然科学基金(050420208)

摘  要:分类是文本信息搜索和挖掘的核心内容,被广泛应用于搜索引擎的设计以及数据挖掘的研究中。首先对文本进行分词,对分词的结果采用x2统计量的方法提取特征,再使用前向神经网络的交叉覆盖算法作为分类器进行文本分类。实验表明,x2统计量可大规模降低特征维数,在此基础上结合交叉覆盖算法的优秀分类能力,可在特征维数较低的情况下获得一个性能较好的文本分类器。Text classification is the key point in text information searching and mining and is widely used in the design of search engine and data mining. Use the method of x^2 statistic to extract text's characteristics after processing the text and then use cross cover algorithm to design a classifier. The result of experiment shows that the method of x^2 statistic can decrease the dimensions effectively and the cross cover algorithm has good classification ability that can achieve a satisfactory classifier.

关 键 词:文本分类 x2统计量 交叉覆盖算法 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象