检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江西理工大学工程研究院,江西赣州341000 [2]江西理工大学信息工程学院,江西赣州341000 [3]江西理工大学应用科学学院,江西赣州341000
出 处:《计算机工程与应用》2013年第21期42-45,共4页Computer Engineering and Applications
基 金:江西省教育厅自然科学基金项目(No.GJJ12346)
摘 要:垂直搜索引擎的主题搜索策略有基于内容评价的搜索策略和基于Web链接分析的搜索策略,其中HITS算法是一种经典的基于Web链接分析的搜索策略,其主要的缺点是容易发生主题漂移。为了最大程度地避免主题漂移,提出了一种结合网页文本分析和扩散速率改进的F-HITS算法。实验结果表明,这些改进不仅节省了系统的开销,并且提高了页面搜索的准确率。Vertical search engines have two kinds of subject search strategy, one is based on content evaluation, the other is based on Web link analysis, and HITS algorithm is a classical search strategy that is based on Web link analysis. Its significant drawback is easy to engender topic drift. In order to avoid engendering topic drift in the maximal degree, this paper puts forward a modified F-HITS algorithm that combines Web' s text analysis with diffusion rate. Experiment' s results show that those improvements not only can decrease system spending but also raise the accuracy of Web page searching.
关 键 词:垂直搜索 搜索策略 扩散速率 文本分析 超链接分析主题搜索(HITS)
分 类 号:TP309[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249