基于内容的网页信息处理方法  被引量:3

Content-based information processing method of Web page

在线阅读下载全文

作  者:王少宇[1] 杜娟[2] 秦前清[3] 

机构地区:[1]武汉大学电子信息学院,湖北武汉430079 [2]武汉大学遥感信息工程学院,湖北武汉430079 [3]武汉大学测绘遥感信息工程国家重点实验室,湖北武汉430079

出  处:《计算机应用》2005年第4期977-978,共2页journal of Computer Applications

摘  要:提出了一种基于内容的网页信息处理方法:利用顺序滤波直接对网页页面内容进行过滤 处理,再根据设置的阈值将过滤后的网页页面变为黑白页面,从而提取出网页中的图像信息。对多个 包含图像信息的网页进行处理的结果表明此方法能较有效的提取出网页中的图像信息。基于此方法 和网页文本信息提取方法的不同原理,还尝试构建了一种基于内容的网页信息处理系统。A content-based method that performs information filtering and extracting on the Internet was put forward. The method directly filtered the content of Web pages using generalized order statistics filter, then converted the filtered Web pages into black and white ones according to the setting threshold, finally image information of Web pages was extracted. The results of several Web pages processed by this method indicate that it can effectively extract image information from Web pages. An attempted system combining the characteristics of the image and text extraction methods was constructed.

关 键 词:INTERNET 信息提取 顺序滤波 图像信息 

分 类 号:TP311.52[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象