检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西安外事学院现代教育技术中心,陕西西安710077
出 处:《计算机技术与发展》2013年第8期220-222,226,共4页Computer Technology and Development
基 金:陕西省教育科学"十二五"规划2012年课题(SGH12534);陕西省2012年度自然科学基础研究计划项目(2012JM8045);2012年西安市社会科学规划基金项目(12IN32)
摘 要:一种好的智能搜索算法对智能Web应用是非常重要的。为了在智能Web应用中实现快速智能搜索且能有效地去除垃圾信息,首先介绍了Lucene开源系统,详细分析了Lucene的系统结构以及PageRank算法。按照Lucene的框架规范,将Lucene很好地嵌入到自己的搜索引擎中,利用爬虫从互联网上收集数据,使用目前流行的Lucene和PageRank搜索技术在收集的数据上进行了实例研究。研究表明若在Lucene搜索中添加PageRank分数,进行混合搜索排序时,相关性高的网页就会排到前面,从而有效提高在智能Web中搜索的准确率及效率。An efficient intelligent search algorithm is very important to intelligent Web. It is an emergent subject for intelligent Web to a- chieve fast intelligent search and effectively screen out waste messages. Lucene is introduced, system structure and PageRank are analysed in detail. Collect information on Intemet by using Web crawler and conduct case analysis, on such information with currently popular Lu- cene and PageRank search techniques. If PageRank score is added in Lucene search ,highly relevant results will be shown on the top dur- ing combined search sequencing, which will significantly improve accuracy and efficiency of search in intelligent Web.
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171