基于DCT压缩域的快速字符定位算法研究  被引量:4

A Fast Text Location Algorithm in DCT-Compressed Domain

在线阅读下载全文

作  者:孙慧平[1] 刘党辉[1] 沈兰荪[1] 

机构地区:[1]北京工业大学信号与信息处理研究室,北京100022

出  处:《电子学报》2006年第4期751-754,共4页Acta Electronica Sinica

基  金:国家自然科学基金(No.60402036);北京市自然科学基金(No.4042008);教育部博士点基金(No.20040005015);总装试验技术项目(No.2005SY4105020)

摘  要:提出一种面向复杂背景JPEG压缩图像的快速字符定位算法.首先从部分解码后的DCT(D iscreteCosine Transform)数据中,提取出一种基于加权频率的字符区新特征,然后经过自适应阈值分类,采用基于二次投影及框融合算法的字符区分割方法,直接在DCT压缩域实现字符区的快速定位.实验表明,该算法可应用于实时或存储空间有限场合下的JPEG图像中的中、英文字符定位,准确率较高,且对图像的背景复杂度具有较好的鲁棒性.A fast and effective approach of automatic text localization in images with complex background is presented. Text areas can be segmented with an adaptive threshold using a new feature extracted from DCT-compressed domain, and then a coarse-to-fine projecting and merging algorithm is proposed to locate the final text area. Experiments based on JPEG image testing sets show its effective and robusmess for contrast, language, and background complexity.

关 键 词:字符定位 DCT系数 加权频率 自适应阈值 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术] TN919.8[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象