检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西安建筑科技大学信控学院,陕西西安710055 [2]西安交通大学电信学院网络所,陕西西安710049
出 处:《微电子学与计算机》2009年第3期200-202,206,共4页Microelectronics & Computer
基 金:国家"八六三"计划项目(2003AA148010);国家火炬计划(2005EB011484)
摘 要:为有效利用超文本中HTML标记提供的分类信息,文中分析了HTML标记对分类的影响,提出了一种基于模糊K最近邻和证据理论的增量式超文本分类方法.该方法将超文本的分类处理分为基于标题、重要段落和全文三个阶段,利用模糊K最近邻方法计算每阶段文本的分类隶属度,利用证据理论增量式融合阶段分类结果.当已有的分类结果可以确定超文本的分类时,对后续阶段不再做处理.实验表明,和全文KNN方法相比,该方法能有效提高分类的查全率和查准率.同时,由于不需要对所有文本进行全文分析,该方法具有更高的执行效率.To effectively utilize HTML tags information in Hypertext web page,the impact of HTML tags on classification is analyzed,an incremental Hypertext classification method based on fuzzy K-nearest neighbor and evidence theory is proposed.The classification is divided into three stages:title based,important sections based and full text based.In each stage,the membership degree for categories is calculated by fuzzy k-nearest neighbor method,then the evidence theory is used to incremental fuse the results of stage...
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.54.133