维、哈、柯多文种搜索引擎中web文本分类的研究  被引量:3

Study on Web Document Classification of Uyghur,Kazak,Kirgiz Multi-lingual Search Engine

在线阅读下载全文

作  者:海丽且木.艾沙 维尼拉.木沙江 

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046

出  处:《新疆大学学报(自然科学版)》2011年第3期362-365,共4页Journal of Xinjiang University(Natural Science Edition)

基  金:国家自然科学基金项目(61063022);新疆维吾尔自治区高校科研计划重点资助项目(XJEDU2006113)

摘  要:研究维、哈、柯多文种搜索引擎中web文本分类问题.根据维、哈、柯Web文本具有结构信息的特点,提出分类系统框架,采用基于改进的KNN的Web文本分类方法,并结合具体实验在对数据进行预处理的基础上实现了改进的KNN分类算法.实验表明,改进的KNN方法在维吾尔文Web文本分类中能够获得较好的分类效果.This paper studies the problems of Uyghur, Kazak, Kirgiz Multi-lingual search engine web document classification. According to the structure of Uyghur, Kazak, Kirgiz web text, a system frame is provided, a Web document classification algorithm based on improved KNN method presented , based on data preprocess, improved KNN method is implemented. The result of research indicates that the impact of the new method is better.

关 键 词:WEB文本分类 KNN算法 特征提取 维吾尔文 

分 类 号:TP39[自动化与计算机技术—计算机应用技术] TP391.3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象