网页分块

作品数:46被引量:181H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:陈竹敏高乐牛正雨于满泉张玉芳更多>>
相关机构:重庆大学吉林大学华中科技大学中国科学院更多>>
相关期刊:《微电子学与计算机》《计算机系统应用》《计算机应用与软件》《计算机应用研究》更多>>
相关基金:国家自然科学基金国家教育部博士点基金国家科技支撑计划国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于自适应四叉树的网页分块技术
《现代计算机》2019年第6期19-22,共4页邢益阳 
不同的浏览器对于相同网页的解释会有差异,在对跨浏览器兼容性测试时通常需要对网页进行分块,而网页的不兼容性对于用户来说往往需要从视觉层面感知。通过对网页截图进行处理,把截图递归切割成4个子图,从网页的最终渲染结果出发,提出基...
关键词:四叉树 网页分块 均方误差 自适应 
基于标签样式和密度模型的网页正文自动抽取被引量:3
《情报科学》2018年第7期123-129,共7页廖建军 
河南省科技开放合作计划(152106000049);河南省科技攻关项目(162102210246)
【目的/意义】为给数字出版知识服务系统提供高质量的文本语料以供知识抽取,本文提出了基于标签样式和密度模型来抽取网页正文的方法。【方法/过程】该方法先根据标签样式将网页文本进行分块,再根据各块文本内容的文本密度、标点密度、...
关键词:正文抽取 标签样式 密度模型 网页分块 信息抽取 
引入主题链接块因子的候选链接搜索策略研究被引量:1
《计算机与数字工程》2018年第5期874-878,共5页周雪 刘乃文 
网页主题爬取过程中,需要计算网页中出现的url权重,不断填充待爬行队列,以满足爬行条件,如何发现与主题最相关的链接,同时又不会导致"主题漂移"问题是关键。针对链接的锚文本较短小,不能很好地表明链接指向页面与主题的相关性的问题,论...
关键词:网页分块 Shark-search算法 链接结构 主题链接块 
改进的Shark-search算法在网络采集中的应用被引量:1
《计算机技术与发展》2017年第8期192-194,199,共4页张玲 祁玉娟 姜华 
湖南省教育科研基金(15C0284)
Shark-search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分析研...
关键词:Shark-search算法 网页分块 Web信息搜集 链接价值 主题漂移 
基于网页分块的科技信息采集系统的设计与实现
《电脑迷》2017年第3期179-180,共2页龙科 李伟强 卢来 
在互联网海量的信息处理上,采用定向追踪的方法,对网络科技信息进行采集、设计、纳入系统框架等工作,是互联网科技信息采集整理系统的主要功能,本文对基于网页分块的科技信息采集系统的设计与实现展开论述,详细论证网页分块、数据消重...
关键词:信息采集 网页分块 系统设计 
基于朴素贝叶斯Web新闻内容的抽取方法被引量:4
《计算机与现代化》2016年第1期59-63,68,共6页罗永莲 赵昌垣 贾玉芳 芦彩林 
山西省高等学校教学改革项目(J2014108);山西省教育科学"十一五"规划课题(GH-08072)
针对网页信息自动抽取问题,提出一种将网页按标记分块并根据朴素贝叶斯理论从中识别新闻正文的方法。该方法将各分块的标记信息、文本相似度以及字长特征作为机器学习的特征属性。为提高标记属性的表征作用,减少相关标记之间的干扰,算...
关键词:朴素贝叶斯 新闻网页 网页分块 正文抽取 相关性检验 
一种基于网页块特征的多级网页聚类方法被引量:1
《山东大学学报(理学版)》2015年第7期1-8,共8页范意兴 郭岩 李希鹏 赵岭 刘悦 俞晓明 程学旗 
国家重点基础研究发展计划("973"计划)项目(2012CB316303);国家高技术研究发展计划("863"计划)项目(2012AA011003);国家科技支撑计划项目(2012BAH39B02);国家自然科学基金资助项目(61232010;61202058)
利用网页的结构特征,提出一种多级网页聚类方法。该方法首先对网页进行分块,然后使用网页的块特征对网页进行聚类。在聚类过程中,通过调整阈值,能够提供三级聚类:同站点网页聚类、同站点同结构网页聚类、同站点同结构同模板网页聚类。...
关键词:网页分块 网页聚类 DOM 
基于HowNet的用户兴趣挖掘研究及应用被引量:1
《计算机与数字工程》2014年第10期1949-1951,1961,共4页朱宝华 
搜索引擎中用户查询和网页资源之间的相似度研究一直是页面排序的研究核心。利用HowNet对词语的语义层次架构模型,对用户的检索词进行兴趣挖掘,同时对检索词和挖掘出的兴趣关键词的语义相似度计算方法进行改进,用户的检索请求与分块后...
关键词:HOWNET 用户兴趣挖掘 网页分块 页面排序 搜索引擎 
一种基于分隔条的网页分块算法被引量:2
《计算机应用与软件》2014年第7期286-289,333,共5页孙学波 张大伟 
网络信息时代的到来使得网络中的信息量呈指数增长,由此研究如何从网页中高效地提取出有用信息成为网络信息检索领域中的重要课题。从网页的可视性和统一性两大基本特征出发,提出一种通过检测分隔条对网页进行分块的算法,并使用相对位...
关键词:Web分块 视觉特征 分隔条 网页分块 
基于分块重要度和二维条件随机场的Web信息抽取被引量:5
《南京大学学报(自然科学版)》2014年第1期79-86,共8页吴秦 胡丽娟 梁久祯 
国家自然科学基金(61202312;61170121)
网页分块方法使得Web信息抽取的单位由原来的页面缩小为分块.结合分块重要度模型与二维条件随机场的优点,提出一种Web对象信息抽取方法.该方法利用分块重要度模型对网页分块进行重要度标注,过滤掉大量与主题无关信息,更加准确的定位待...
关键词:WEB对象 信息抽取 网页分块 分块重要度模型 二维条件随机场 
检索报告 对象比较 聚类工具 使用帮助 返回顶部