基于kNN的快速WEB文档分类  被引量:13

A Fast Document Classification Based on the k-Nearest Neighbor

在线阅读下载全文

作  者:李杨[1] 曾海泉[1] 刘庆华 胡运发[1] 

机构地区:[1]复旦大学计算机系数据库中心,上海200433 [2]江西省南昌高等专科学校计算机系,江西南昌330009

出  处:《小型微型计算机系统》2004年第4期725-729,共5页Journal of Chinese Computer Systems

基  金:国家自然科学基金 ( 60 173 0 2 7)资助

摘  要:根据测试文档在各个样本类中的分布情况 ,发现了基于 k NN分类的两个有助于减少大量计算的重要性质 ,在此基础上提出了两个重要算法 :排类算法和归类算法 ,从而构建了一个基于 k NN的快速 Web文档分类方法 .理论与实验表明 ,这种方法可以在不影响原有准确率的条件下 。According to the test document distributing in the sample classes, We discover two important properties of the kNN, which can decease greatly the amount of computation during the classifying and give two algorithm EXCLUDING CLASS and INCLUDING CLASS on the based of the two properties. In addition, a fast web document classification paradigm has been presented. Our experimental results illustrate this paradigm can increase the classification speed dramatically while not decreasing its precision of original kNN classification.

关 键 词:文档分类 KNN 快速分类 排类算法 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象