一种基于超级链接结构的WWW模糊聚类算法  被引量:3

WWW Fuzzy Clustering Algorithm Based on Link Structure

在线阅读下载全文

作  者:陈晓平[1] 许卓明[2] 

机构地区:[1]常州技术师范学院人事处,江苏常州213001 [2]河海大学计算机及信息工程学院,江苏南京210098

出  处:《常州技术师范学院学报》2002年第2期47-52,共6页Journal of Changzhou Teachers College of Technology

摘  要:搜索引擎是目前最主要的WWW信息检索的工具 ,然而 ,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软 )聚类算法HTSC。对HTSC算法进行了理论分析 ,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类 ,以方便用户从中找到真正需要的信息。Today, search engines are the most commonly used tools for Web information retrieval. Howe-ver, their current status is still far from user's satisfaction. This paper presents a fuzzy (soft) clustering algorithm (Hyperlink-Text based Soft Clustering ) using a mixed similarity metric of document contents and intercocument hyperlinks, for clustering Web search results from a search engine in order to help users find relevant Web information more easily. This paper includes the following: an effective method for computing interdocument similarities based on contents and link analysis: presenting a fuzzy (soft) clustering algori-thm HTSC base on a mixed similarity metric of contents and link: theoretic analysis and preliminary exp-eriments of the algorithm

关 键 词:超级链接结构 WWW 模糊聚类算法 万维网 信息检索 搜索引擎 混合相似度 内容分析 超链分析 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象