基于文本特征的Deep Web分类研究  

Research on Text Feature-based Deep Web Classification

在线阅读下载全文

作  者:罗国涛[1] 马在强[1] 

机构地区:[1]四川托普信息技术职业学院计算机科学与技术系,四川成都611743

出  处:《计算机与现代化》2012年第10期58-61,64,共5页Computer and Modernization

摘  要:讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法。利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对分类精度、召回率和综合F-measure等测度上的分类结果进行比较。实验结果表明,该方法模型在3个指标上表现都较为突出。Several critical leading techniques are discuss for Deep Web database classification,TF-IDF and DOM-tree-based feature extraction model is established,improved weighted K-NN classification algorithm is proposed.This paper utilizes UIUC datasets and WEAK platform to carry out experiments.Results of the method(precision,recall rate and F-measure measure) and that of other literatures are compared,each indicator displays good performance.

关 键 词:DEEP Web 网页文本 词频 K-NN分类算法 DOM树 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象