基于后缀树的维吾尔文网页聚类算法的研究与实现  

Uighur Web Clustering Algorithm and Implementation

在线阅读下载全文

作  者:买买提依明·哈斯木[1] 维尼拉·木沙江[1] MAMTIMIN Kasim, WINIRA Musajan (School of Information Science and Engineering, Xinjiang University, Urumqi 830046, China)

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046

出  处:《电脑知识与技术》2010年第9期7072-7073,7075,共3页Computer Knowledge and Technology

基  金:国家自然科学基金项目(61063026)

摘  要:该论文分析维吾尔语的词法特点,选择适合维吾尔文文本聚类的特征,构造可扩展后缀树,选择基类,合并基类,把维吾尔文网页按相似度分成不同的类,并形成类标签。通过实验表明该算法的效率比其他传统的聚类算法比具有较高的性能.大大提高查找信息的命中率。This paper analyzes the lexical features of Uighur, Uighur choose the characteristics of text clustering, construct a generalized suffix tree, select the base class, emerge base class, the Uigbur page is divided into different classes according to similarity and form a class label. Experiments show that the algorithm is more efficient than other traditional clustering algorithm has higher performance, greatly increased the hit rate of finding information.

关 键 词:聚类 后缀树 STC 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象