检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]常州技术师范学院人事处,江苏常州213001 [2]河海大学计算机及信息工程学院,江苏南京210098
出 处:《常州技术师范学院学报》2002年第2期47-52,共6页Journal of Changzhou Teachers College of Technology
摘 要:搜索引擎是目前最主要的WWW信息检索的工具 ,然而 ,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软 )聚类算法HTSC。对HTSC算法进行了理论分析 ,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类 ,以方便用户从中找到真正需要的信息。Today, search engines are the most commonly used tools for Web information retrieval. Howe-ver, their current status is still far from user's satisfaction. This paper presents a fuzzy (soft) clustering algorithm (Hyperlink-Text based Soft Clustering ) using a mixed similarity metric of document contents and intercocument hyperlinks, for clustering Web search results from a search engine in order to help users find relevant Web information more easily. This paper includes the following: an effective method for computing interdocument similarities based on contents and link analysis: presenting a fuzzy (soft) clustering algori-thm HTSC base on a mixed similarity metric of contents and link: theoretic analysis and preliminary exp-eriments of the algorithm
关 键 词:超级链接结构 WWW 模糊聚类算法 万维网 信息检索 搜索引擎 混合相似度 内容分析 超链分析
分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3