网页自动分类融合模型研究  

Study on WEB Page Classification Fusion Model

在线阅读下载全文

作  者:张晓丹[1] 梁冰[1] 王丽[1] 白海燕[1] 吕世炅[1] 肖晶[1] 

机构地区:[1]中国科学技术信息研究所,北京100038

出  处:《数字图书馆论坛》2011年第8期57-60,共4页Digital Library Forum

基  金:本课题获以下项目基金资助:国家自然科学基金(基金号:60805050);“十二五”国家科技支撑计划项目(项目编号:2011BAH10B05);中国科学技术信息研究所预研项目(项目编号:YY-2010023).

摘  要:为了提高网页自动分类的准确率,基于信息融合的模型理论,提出了一种通用的网页自动分类模型和融合算法。该模型根据完成功能的不同分为四个层次:信息抽取层、数据预处理层、特征层和决策层,其中特征层是针对网页上不同种类的媒体信息采用不同的分类方法进行分类,并将分类结果分别输入决策层和与该特征层算法相关的其他的特征层。决策层是处理特征层的分类结果,并推导出最终的网页分类融合结果,并将该模型和算法进行了实现。实验表明,文章提出的融合模型和算法可以有效地改进网页自动分类准确率。For higher text classification precision, a general feature layer fusion classification model and algorithm are proposed, based on model theory of information fusion, adopting multi-information of the network for different classification, text and image information are used in the paper. The model includes two layers mainly, one is feature layer, which deals with different Media information with different classification algorithm, and inputs the classification results into the higher layer fusion centre separately. The other is decision layer, which deals with the results from the feature layer, and concludes the final classification result. The experiment expresses the fusion model can improve the text classification precision effectively.

关 键 词:网页自动分类 信息融合 融合模型 信息检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象