检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机技术与发展》2010年第7期17-20,24,共5页Computer Technology and Development
基 金:国家科技支撑计划课题(2007BAH08B04)
摘 要:因为图像相比文字具有更强的表现力,站点的设计者在设计广告时考虑的首要问题是如何吸引用户的"眼球",所以通常网页中的广告通常都是以图像的形式嵌入到网页中。这使得在HTML网页正文提取中主要处理的就是广告图像。文中综合分析了网页中图像的特点,提出了区域分块的HTML元素删除法来清除网页中的广告等无关图像并提取网页正文。实验结果表明,所提出的区域分块的HTML元素删除法很好地解决了网页正文提取中图像处理问题。Because the images have a stronger than expressive writing,the site designers in the design of ads most important issue to consider is how to attract the user's"eye",it is usually the page the ads are usually in the form of images embedded in web pages.This makes the body of the HTML page is primarily concerned with the extraction of advertising images.This paper analyzes the characteristics of the image in a web page and put forward a regional block of HTML elements to delete method to remove the advertisements,web pages unrelated to the image and extract the body of the page.Experimental results show that the proposed sub-block of HTML elements in the region to delete method solves the body of the web page extraction of image processing problems.
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28