搜索引擎查询日志中的聚类算法研究  被引量:1

STUDYING OF AGGLOMERATIVE CLUSTERING ALGORITHM IN SEARCH ENGINE QUERY LOG

在线阅读下载全文

作  者:勾海波[1] 欧阳为民[2] 徐春荣[1] 

机构地区:[1]上海大学计算机工程与科学学院,上海200072 [2]上海大学计算机网络中心,上海200072

出  处:《计算机应用与软件》2007年第3期145-147,共3页Computer Applications and Software

摘  要:近年来,随着网络数据挖掘技术的迅猛发展,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向。首先详细讨论了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及噪声数据对该算法的影响,指出了Chan的改进算法中的一个错误,最后提出一个新的改进算法,并且通过模拟实验对几种不同的算法进行了对比。During the recent years,with the rapid development of Web data mining, how to find useful information in search engine log query has become an important research direction. This paper discussed in detail firstly an agglomerative clustering algorithm proposed by Beeferman which is invented to do clustering work in search engine query logs and the influence caused by noisy datum ,then pointed out an error in the improved algorithm proposed by Chan, finally proposed an improved clustering algorithm and compared these algorithms through simulation.

关 键 词:网络数据挖掘 搜索引擎查询日志 聚合式聚类 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象