企业级搜索引擎技术在博客网站中的应用  被引量:1

Application of enterprise search engine technology in Blog website

在线阅读下载全文

作  者:张雪燕[1] 杨晟刚[2] 黄文[1] 冯姚震[1] 

机构地区:[1]宁波广播电视大学信息技术系,浙江宁波315020 [2]燕山大学工业计算机控制工程河北省重点实验室,河北秦皇岛066004

出  处:《计算机工程与设计》2008年第18期4856-4858,4861,共4页Computer Engineering and Design

基  金:宁波社科院网络研究所基金项目(WL06-02);宁波市教育科学规划基金项目(YGH-111)

摘  要:随着网络技术的发展和广泛应用,安全的监控网站内容已成为研究的热点之一。根据博客网站体系结构的特点,提出采用企业级搜索引擎技术监控其内容的方法,将索引词库中的词条与非法关键字表进行比较,及时发现非法数据,然后通过审查程序发送信息给管理人员,从而能及时处理问题网页,达到实时和有效的个性化监控,极大地减轻了管理人员的工作负荷。测试实验结果表明,该系统在保证查全率和查准率的基础上,提高了搜索效率并满足了对网站内容的监控要求。With the development and widely appliance of the network technology, how to supervise the blog websites is one of the research hotspots nowadays. Based on the characteristics ofblog websites' architecture, the enterprise search engine is adopted to supervise blog websites, the terms are compared in the indexing term lib with illegal-keyword table to fred illegal data in time and send messages to the administrator through checkup program. Thus the administrator can dispose the page in proper and in time. This system can realize real-time and effectively distinctive supervising, greatly relieses administrators' working load. The experiments show that this system improves searching efficiency and meets the requirements of supervising the website based on assuring the recall and precision ratio.

关 键 词:企业级搜索引擎 网页等级 网络爬虫 查全率 博客 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象