藏文WEB文档分类算法  

Tibetan WEB Document Classification Algorithm

在线阅读下载全文

作  者:刘昕[1] 安见才让[1] 

机构地区:[1]青海民族大学计算机学院

出  处:《微型电脑应用》2016年第8期1-2,共2页Microcomputer Applications

基  金:青海2014年度教育部"春晖计划"合作科研项目(Z2015054)

摘  要:针对藏文WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出了一种基于Java Bean模式的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(log(n)),该算法与经典的串行算法相比,能显著地提高分类速度。To optimize the high computation complexity of KNN algorithm in Tibetan web document classification, a parallel algo- rithm, based on Java Bean mode, is proposed. It means that the time-critical portions of computation complexity can be shortened from O(n2) to O(log(n)). What's more, it's different from the traditional way by reducing the training sample size and using high-speed algorithm. All in all, comparing with the typical serial algorithm, it can dramatically increase classification speed.

关 键 词:文档分类 K近邻 并行策略 藏文WEB文档 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象