图像垃圾邮件中文本区域的自动提取方法  被引量:1

Text region extraction in image-based spam email

在线阅读下载全文

作  者:程红蓉[1] 秦志光[1] 万明成[1] 王灿[1] 靳京[1] 傅翀[1] 

机构地区:[1]电子科技大学计算机科学与工程学院,四川成都610054

出  处:《解放军理工大学学报(自然科学版)》2009年第3期258-261,共4页Journal of PLA University of Science and Technology(Natural Science Edition)

基  金:国家863计划资助项目(2006AA01Z411)

摘  要:图像中的文本区域为判别图像垃圾邮件提供了重要依据。为了获得图像中的文本区域信息,提出了基于Hough变换提取图像中倾斜文本区域的算法和降低图像背景干扰的八邻域细小边缘去除算法,实现了一种不受图像中文本颜色、字体、大小、位置、方向限制的文本区域的自动提取方法。在包含100幅垃圾图像的数据集上进行提取图像文本区域的实验。实验结果显示,新方法具有良好的文本区域提取性能。Text regions provide an important clue for filtering image spam. To get the information of the text region in image spam, an algorithm based on Hough transform was proposed for slant text region extraction, and a tiny region removal algorithm based on eight-neighbor pixels was also proposed for effectively eliminating the disturbance of background image. The two algorithms were integrated to implement an approach of automatic extraction of the text region. The new approach was insensitive to the orientation, location, color, font, and size of the text. The simulation experiments were carried on among a collection of 100 spam images. Results show a good performance of text region extraction.

关 键 词:HOUGH变换 文本区域提取 图像垃圾邮件判别 彩色边缘检测 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象