检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院软件所软件工程技术中心,北京100080
出 处:《小型微型计算机系统》2004年第3期347-351,共5页Journal of Chinese Computer Systems
基 金:国家重点基础研究发展规划 973项目 ( G19990 3 5 80 6)资助;国家自然科学重点基金 ( 6983 3 0 3 0 )资助
摘 要:传统的主题抽取方法单纯依靠分析网页内容的来自动获取网页主题 ,其分析结果并不十分精确 .在 WWW上 ,网页之间通过超链接来互相联系 ,而链接关系紧密的网页趋向于属于同一主题 .基于这一思想 ,本文提出了一种利用 Web链接结构信息来对主题抽取结果进行求精的方法 ,其通过所链接网页对本网页的影响来修正本网页的主题权值 .本文还通过一个实际应用例子 。Traditional topic extraction methods acquire web pages' topics only by analyzing the pages' content, and the analyzing results are not very accurate. In WWW, Web pages are connected with each other by hyperlinks. Web pages tightly connected with each other tend to belong to the same topics. According to this idea, this paper presents a method base on analyzing Web link structure information.It amends Web pages' topic weights according to the affections of the pages linked by these pages. Then it makes the topic extraction results more accurate. This page also analyzes this method's features by applying it to an application example.
关 键 词:WEB信息检索 Web链接结构 主题抽取 网页 主题权值
分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222