网页过滤

作品数:52被引量:43H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:胡卫明朱明亮张迎周吴偶熊国萍更多>>
相关机构:深圳市腾讯计算机系统有限公司中国科学院自动化研究所北京邮电大学南京邮电大学更多>>
相关期刊:《软件导刊》《网络安全技术与应用》《中文信息学报》《中南林业科技大学学报》更多>>
相关基金:国家自然科学基金上海市高等学校青年科学基金国家高技术研究发展计划广东省教育部产学研结合项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于因子分解机的灰色产业服务网页过滤方法被引量:1
《软件导刊》2019年第9期150-153,157,共5页付强 裴佩 丁永刚 
湖北省高等学校人文社科重点基地绩效评价管理研究中心项目(2015JX01)
互联网灰色产业服务日益泛滥,而传统的网页过滤算法无法准确高效地过滤掉灰色产业服务网页。为解决这一问题,基于TF*IDF提出一种改进的网页特征提取和权重计算方法,利用因子分解机模型对网页进行分类,并以代孕网站为例进行实验和评估。...
关键词:灰色产业服务 网页过滤 特征选择 权重计算 因子分解机 
基于向量空间模型的网页过滤分析
《电子技术与软件工程》2016年第12期9-10,共2页胡辉 胡松 陈伽 蔡昭权 
广东省教科规划项目(11JXZ012;14JXN065);广东省自然科学基金项目(S2013010013432;S2013010015940);广东省教育厅项目(2013LYM00874);广东省高校优秀青年创新人才培养计划资助项目(2013LYM_0087);惠州市科技计划项目(2013B020015008;2014B020004026;2014B050013016;2014B020004023;2015B010002002)
随着互联网的快速发展和进步,其已经在电子商务、电子政务、金融证券、电力通信、科教文卫等领域得到广泛普及和使用,已经积累了海量数据信息,因此亟需利用先进的机器学习、模式识别等数据挖掘技术过滤网页内容。论文详细地分析了基于...
关键词:向量空间 网页过滤 相似度 特征项 
基于改进SVM的网页过滤系统研究被引量:2
《软件导刊》2016年第2期159-161,共3页李兆翠 朱振方 李颖 
山东协和学院校级科技项目(XHXY201417)
对比分析了几种常见的网络文本分类方法。其中,支持向量机具有较高的分类准确率。提出支持向量机改进算法,将多项式核函数和径向基核函数加权组合成混合核函数。该核函数克服了支持向量机中单个核函数的局限性,可兼顾算法的学习能力和...
关键词:SVM 网页过滤 混合核函数 文本分类 
基于扩展主题特征库的领域主题爬虫被引量:2
《计算机工程与设计》2015年第5期1342-1347,共6页吴岳廷 李石君 
国家自然科学基金项目(61272109)
在领域主题爬虫中,为提高网页爬取的效率和准确性,将扩展主题特征库(extended topic feature library,ETFL)引入进爬虫的网页过滤算法中。将网页抽象为标签块节点集,通过主题特征库扩展算法对静态特征项进行扩充生成扩展主题特征库,利...
关键词:主题特征库 网页过滤 标签块 相关性 语义 
基于字频分布的中文网页编码识别算法被引量:2
《计算机工程》2014年第12期199-204,共6页侯整风 张浩 张娜 
教育部广东省产学研基金资助项目(2009B090200049)
编码识别是网页内容过滤的必要前提,多种中文编码共存给中文网页的内容过滤带来不便。针对上述问题,提出一种基于字频分布的中文网页编码识别算法。根据汉字的使用频率,选取使用频度较高的字符构成高频字符编码表,以高频字符编码作为关...
关键词:中文编码 网页过滤 高频字符 模式匹配 有限状态自动机 
基于SVM的三重网页过滤方法研究被引量:1
《软件导刊》2014年第11期25-27,共3页李兆翠 朱振方 许红云 
山东协和学院校级科技项目(XHXY201417)
针对当前过滤方法过滤不良信息的缺陷和不足,建立并采用三重网页过滤模型,将健康信息推荐给用户,将带有不良信息的网页过滤掉。第一层过滤采用基于关键词匹配的方法,快速识别出健康网页,推荐给用户;第二层采用基于贝叶斯的过滤方法,将...
关键词:信息过滤 关键词过滤 贝叶斯 SVM 
一种中文领域网页过滤方法被引量:2
《北京理工大学学报》2014年第5期533-536,共4页刘杰 骆力明 吴宇航 马轶芳 蔡红梅 
国家自然科学基金资助项目(61371194)
鉴于互联网上各种不良网页的影响,提出了一种使用贝叶斯分类算法和领域本体过滤中文网页的方法。该方法根据正反例领域网页计算领域特征词的权重,建立领域特征词库并制作领域本体,根据正例领域网页得到本体元素权重库;使用贝叶斯分类算...
关键词:网页过滤 网页屏蔽 语义过滤 
基于BHO构建轻量级上网行为监控系统
《计算机工程与设计》2013年第6期1962-1966,共5页寇晓蕤 
基于BHO劫持技术实现了一个轻量级的上网行为监控系统。该系统通过BHO实现与IE浏览器的绑定,确保了用户每个Web页面浏览行为都能得到有效监控。通过捕获DISPID_BEFORENAVIGATE2和DISPID_DOCUMENT-COMPLETE事件,并使用页面替换和脚本执...
关键词:BHO 网站屏蔽 网页过滤 捎带机制 轻量级 
基于海量冗余网页过滤的Web挖掘技术研究被引量:2
《科技通报》2013年第4期21-22,25,共3页赵玺 
智能教学系统通过搜索网页关键词获取教学资源时,由于存在许多具有相同关键词的垃圾网页的影响,使得教学资源较难从海量网页信息中快速挖掘出来,传统的关键词查找方法受垃圾网页的影响使得搜索量过大,造成智能教学资源获取的及时性不高...
关键词:智能教学 垃圾网页 信息抽取 
面向终端用户的网页过滤模板动态生成技术研究被引量:2
《计算机科学》2012年第S2期90-93,共4页徐慧 窦子辉 杨林 陈雪 
为了满足网络终端用户对网页噪音的过滤需求,提出一种面向终端用户的动态模板网页过滤系统模型,它基于模板并利用用户反馈自动进化过滤系统。设计了模板生成算法,模拟实验验证了该算法的有效性。
关键词:网页过滤 动态模板 DOM树 
检索报告 对象比较 聚类工具 使用帮助 返回顶部