基于主题词匹配频数的搜索引擎结果聚类算法  被引量:2

An Algorithm for the Search Results Clustering Based on Topic Words Matching Frequency

在线阅读下载全文

作  者:胡诗未[1] 李晓峰[1] 徐伟[1] 

机构地区:[1]四川大学计算机学院,四川成都610064

出  处:《计算机工程与科学》2011年第6期130-132,共3页Computer Engineering & Science

基  金:国家自然科学基金资助项目(60736046)

摘  要:搜索引擎结果聚类对提高搜索引擎服务质量和智能化水平有较高的应用价值,它是从标题和文档片段的有限信息中寻找文档相关度进行聚类。传统搜索引擎聚类没有充分利用搜索引擎结果的自身特点,或者计算复杂度较高。本文提出了一种基于主题词匹配频数的搜索引擎聚类算法,该算法从高频词中筛选出主题词,根据主题词共现情况自动产生类别,其他结果依据满足与类别主题词表的匹配频数的文档数进行聚类。实验结果与STC和LINGO算法相比,搜索质量有所提高。Search engine results clustering has a high application value to the search service quality and the intelligence level,which clusters by seeking the document relations from the title and the document segment information.An algorithm based on topic words matching frequency is proposed.It automatically generate categories according to the graph of the semantic relevance,with other results clustering by topic words matching frequency.Experiments show that,compared with the STC and LINGO algorithms,the algorithm performs better.

关 键 词:搜索结果聚类 词间语义相关度 文档相似度 主题词 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象