基于模糊概念图的文档聚类及其在Web中的应用  被引量:12

A Documental Clustering Algorithm Based on Fuzzy Concept Graph and Its Application in Web

在线阅读下载全文

作  者:陈宁[1] 陈安[2] 周龙骧[3] 贾维嘉[4] 罗三定[4] 

机构地区:[1]中国科学院研究生院信息学院,北京100039 [2]中国科学院科技政策与管理科学研究所 [3]中国科学院数学与系统科学研究院,北京100080 [4]香港城市大学计算机科学系

出  处:《软件学报》2002年第8期1598-1605,共8页Journal of Software

基  金:~~国家自然科学基金资助项目(69983011);中国博士后基金资助项目

摘  要:随着World Wide Web上数据量的日益庞大,现有的搜索引擎已经不能满足用户日益增长的需求.利用数据挖掘技术,提高搜索效率,实现了查询的用户化.首先提出了模糊概念图的模型来描述词语间的关系,然后在聚类过程中引入概念知识,提出了基于模糊概念图的文档聚类算法,通过分析用户的浏览行为发现兴趣模式.在上述技术的基础上,给出了一种用户化的智能搜索系统的实现策略,通过分析概念间的关系和用户的兴趣模式,评价超链/文档和查询的相关程度,从而帮助用户得到更准确的信息.With the explosive growth of data available on World Wide Web, it seems that the current search engines cannot meet the increasing requirement of users. This paper focuses on improving the effectiveness and the efficiency of Web search with data mining technology. A documental clustering algorithm is presented integrated with fuzzy concept graph for mining interest patterns. Based on the above technology, an intelligent customized search system is proposed that enables users to obtain useful information according to the relation of concepts and own interests. The strategy is to evaluate the relevance of documents effectively based on fuzzy concept graph and user抯 personal interests.

关 键 词:模糊概念图 文档聚类 WEB 计算机网络 兴趣模式 用户化智能搜索 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象