页面分块

作品数:10被引量:32H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:徐杰锋郭坤银李子茂刘晶齐峰更多>>
相关机构:百度在线网络技术(北京)有限公司哈尔滨工业大学山东大学中南民族大学更多>>
相关期刊:《计算机工程与设计》《微处理机》《山东大学学报(理学版)》《电脑与信息技术》更多>>
相关基金:国家自然科学基金山东省博士后创新项目国家科技支撑计划江苏省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-9
视图:
排序:
PDF文档HTML化中文本重排问题研究
《电脑与信息技术》2014年第3期27-30,共4页林青 李健 
目前各种PDF转化工具中,将PDF元素抽取后还原顺序的方法是根据每个文字元素的坐标——由左到右,由上到下的顺序重排元素。这种重排方式无法正确还原多栏或者多区域的PDF文档。文章提出了一种页面分块算法。所提算法将页面划分为不同的区...
关键词:页面分块 多栏PDF文档 文本重排 
Web邮件信息块提取技术研究
《无线互联科技》2014年第3期152-152,共1页李盈润 
在对大量Web邮件页面模式分析的基础上,对页面进行分块,并根据信息块的结构与内容属性,实现主题信息块和主题相关信息信息块的析取,对邮件信息的自动获取和邮件下载系统的设计与开发具有重要意义。
关键词:多策略 页面分块 信息提取 邮件下载系统 
基于CURE算法的网页分块及正文块提取研究被引量:1
《微型机与应用》2012年第12期11-14,共4页王超 徐杰锋 
研究基于CURE聚类的Web页面分块方法及正文块的提取规则。对页面DOM树增加节点属性,使其转换成为带有信息节点偏移量的扩展DOM树。利用CURE算法进行信息节点聚类,各个结果簇即代表页面的不同块。最后提取了正文块的三个主要特征,构造信...
关键词:WEB信息抽取 聚类算法 页面分块 正文块提取 
基于页面分块的网页排序算法:BHITS被引量:2
《计算机工程》2010年第11期64-66,72,共4页蒋建中 丁宝琼 吴琼 邱文武 
介绍大型搜索引擎应用的主流网页排序算法,改进其中的HITSS算法,提出一种基于网页分块技术的BHITS算法。BHITS算法通过对分好的页面板块进行主题标定,根据待采集信息的主题为不同主题的板块设定不同的权值实现相关度判定,在保持算法高...
关键词:网页排序 搜索引擎 WEB信息检索 权值 
基于视觉特征的网页正文提取方法研究被引量:13
《微型机与应用》2010年第3期38-41,共4页安增文 徐杰锋 
利用网页的视觉特征和DOM树的结构特性对网页进行分块,并采用逐层分块逐层删减的方法将与正文无关的噪音块删除,从而得到正文块。对得到的正文块运用VIPS算法得到完整的语义块,最后在语义块的基础上提取正文内容。试验表明,这种方法是...
关键词:页面分块 信息提取 视觉特征 
基于Web标准的页面分块算法研究被引量:2
《微处理机》2009年第6期58-61,共4页郭坤银 邢永康 
国家自然科学基金青年基金资助(编号60403009)
页面分块在文档分类,信息抽取,主题信息采集,以及搜索引擎优化等方面具有重要的作用。首先提出了一种基于Web标准的页面分块算法,通过对网页进行解析和布局分析,利用Web标准对网页进行分块。实验证明该算法在对遵循Web标准的网页进行分...
关键词:页面分块 层叠样式表 语义块 
基于DOM的评论发现及抽取模型研究被引量:5
《计算机工程与设计》2007年第9期2150-2153,共4页李姜 
国家自然科学基金项目(50376029)
Internet发展至今,除了静态的网页文本,目前出现较多的是基于动态文本的BBS评论、电子商务评论等。如何自动挖掘这些评论信息,变得日益重要。提出了一种新颖的评论算法进行评论信息的发现与抽取。采用了DOM技术对页面进行分块,同时结合...
关键词:评论抽取 文档对象模型 信息熵 页面分块 迭代计算 
面向移动设备的WEB页面分块算法被引量:1
《小型微型计算机系统》2007年第9期1672-1677,共6页路松峰 王丹丹 
国家自然科学基金项目(60403027)资助
随着通信技术的发展,人们迫切希望能方便地利用手持移动设备访问Web网站,由于移动设备的小屏幕和低带宽的缺点,使得这一难题一直没有得到很好的解决.本文提出一种适合于移动设备小屏幕的Web页面分块算法,算法利用Web网页上对象的位置信...
关键词:页面转换 页面分块 移动设备 
基于页面分块与信息熵的评论发现及抽取被引量:4
《计算机应用研究》2007年第2期269-271,291,共4页李慧 沈洁 张舒 顾天竺 吴颜 陈晓红 
江苏省自然科学基金资助项目(BK2005046)
提出了一种新颖的REA(Review Extract Algorithm)算法进行评论信息的发现与抽取。算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。其中,页面分块技术的运用有效地去除了噪声信息;基于块的熵值计算精确定位了...
关键词:评论抽取 自动 语义块  
检索报告 对象比较 聚类工具 使用帮助 返回顶部