检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张雪燕[1] 杨晟刚[2] 黄文[1] 冯姚震[1]
机构地区:[1]宁波广播电视大学信息技术系,浙江宁波315020 [2]燕山大学工业计算机控制工程河北省重点实验室,河北秦皇岛066004
出 处:《计算机工程与设计》2008年第18期4856-4858,4861,共4页Computer Engineering and Design
基 金:宁波社科院网络研究所基金项目(WL06-02);宁波市教育科学规划基金项目(YGH-111)
摘 要:随着网络技术的发展和广泛应用,安全的监控网站内容已成为研究的热点之一。根据博客网站体系结构的特点,提出采用企业级搜索引擎技术监控其内容的方法,将索引词库中的词条与非法关键字表进行比较,及时发现非法数据,然后通过审查程序发送信息给管理人员,从而能及时处理问题网页,达到实时和有效的个性化监控,极大地减轻了管理人员的工作负荷。测试实验结果表明,该系统在保证查全率和查准率的基础上,提高了搜索效率并满足了对网站内容的监控要求。With the development and widely appliance of the network technology, how to supervise the blog websites is one of the research hotspots nowadays. Based on the characteristics ofblog websites' architecture, the enterprise search engine is adopted to supervise blog websites, the terms are compared in the indexing term lib with illegal-keyword table to fred illegal data in time and send messages to the administrator through checkup program. Thus the administrator can dispose the page in proper and in time. This system can realize real-time and effectively distinctive supervising, greatly relieses administrators' working load. The experiments show that this system improves searching efficiency and meets the requirements of supervising the website based on assuring the recall and precision ratio.
关 键 词:企业级搜索引擎 网页等级 网络爬虫 查全率 博客
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7