一种面向聚焦爬虫的自然场景文本定位技术  被引量:4

Locating Natural Scenes Text for Focused Crawler

在线阅读下载全文

作  者:彭浩[1] 陈继锋[1] 刘琼[1] 王海涛[1] 高海波[1] 

机构地区:[1]湖南涉外经济学院信息科学与工程学院,长沙410205

出  处:《小型微型计算机系统》2014年第9期2014-2018,共5页Journal of Chinese Computer Systems

基  金:湖南省科技计划项目(2014FJ3040;2013GK3113)资助;湖南省教育厅科学研究优秀青年项目(14B104)资助;湖南省教育厅科学研究项目(13C495;14C0654);湖南省普通高等学校教学改革研究项目(湘教通[2012]401);湖南涉外经济学院科学研究项目(湘外经院科字[2013]2)资助

摘  要:各类视频设备采集的图像中包含了高质量的海量主题信息.尽可能全面地找到自然场景中的文本,对聚焦爬虫具有重要意义.提出一种具有较高召回率的文本定位技术,充分注意到角点强度极大、极小值对自然场景文本定位的重要作用,运用提出的角点强度增强技术和三值化方法,能够有效地分离出极大、极小值区域,从而,能够将图片中的大部分文字从复杂的背景和各种噪声中凸显出来.实验表明,该方法能够大幅提高基于角点特征的定位算法的召回率,为聚焦爬虫从大量的自然场景图片中获取重要的主题信息提供了可能.Vast amounts of natural scene pictures contain subject information with high quality, and it' s a new subject information resource for focused crawler. We propose a novel comer analysis technique for natural scene text location. Considering both the minimum and the maximum of comer intensity clearly remark the locations of text in natural scene, we non-lineally enhance the comer intensity of every pixel, and then binarize it. As we show, the binarized comer map shows the salient text blocks. The experiment result shows that our comer analysis technique can help the text localization algorithm based on its significantly improving its recall. Our corner analysis technique can help focused crawler crawl more real-time subject information from vast amounts of natural scene pictures captured by mobile and web camera.

关 键 词:角点增强 角点强度三值化 文本定位 自然场景 聚焦爬虫 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象