基于模糊K最近邻和证据理论的增量式超文本分类方法  

Incremental Hypertext Classification Based on Fuzzy K-Nearest Neighbor and Evidence Theory

在线阅读下载全文

作  者:侯琳[1] 廖明涛[2] 李金库[2] 

机构地区:[1]西安建筑科技大学信控学院,陕西西安710055 [2]西安交通大学电信学院网络所,陕西西安710049

出  处:《微电子学与计算机》2009年第3期200-202,206,共4页Microelectronics & Computer

基  金:国家"八六三"计划项目(2003AA148010);国家火炬计划(2005EB011484)

摘  要:为有效利用超文本中HTML标记提供的分类信息,文中分析了HTML标记对分类的影响,提出了一种基于模糊K最近邻和证据理论的增量式超文本分类方法.该方法将超文本的分类处理分为基于标题、重要段落和全文三个阶段,利用模糊K最近邻方法计算每阶段文本的分类隶属度,利用证据理论增量式融合阶段分类结果.当已有的分类结果可以确定超文本的分类时,对后续阶段不再做处理.实验表明,和全文KNN方法相比,该方法能有效提高分类的查全率和查准率.同时,由于不需要对所有文本进行全文分析,该方法具有更高的执行效率.To effectively utilize HTML tags information in Hypertext web page,the impact of HTML tags on classification is analyzed,an incremental Hypertext classification method based on fuzzy K-nearest neighbor and evidence theory is proposed.The classification is divided into three stages:title based,important sections based and full text based.In each stage,the membership degree for categories is calculated by fuzzy k-nearest neighbor method,then the evidence theory is used to incremental fuse the results of stage...

关 键 词:超文本分类 模糊K最近邻 证据理论 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象