检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘佐达[1] 张久岭[1] 陈茂科[2] 李星[1,2]
机构地区:[1]清华大学电子工程系,北京100084 [2]清华大学网络中心,北京100084
出 处:《郑州大学学报(理学版)》2010年第2期22-25,共4页Journal of Zhengzhou University:Natural Science Edition
基 金:国家973重大基础研究发展规划项目;编号2007CB310806
摘 要:对BBS的数据结构进行了分析研究,并根据BBS特点设计了一种用于BBS信息检索的主题网络爬虫算法.通过主题网络爬虫能够提高抓取网页的效率,同时又可以保证较高的召回率.实验表明,该算法大幅提高了信息检索的效率,改善了信息检索的效果.The architecture of BBS is analyzed. And a suitable focused crawling algorithm is proposed, which improves the efficiency. A BBS search engine is designed based on the proposed algorithm. Practical experiments have been carried out, which show that the recall ratio as well as the accuracy of searching has been enhanced.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.217