基于Deformable DETR的自然场景任意形状文本检测  被引量:1

Arbitrary-shaped Text Detection Based on Deformable DETR

在线阅读下载全文

作  者:张子旭 游钰玮 仝明磊 薛亮 ZHANG Zixu;YOU Yuwei;TONG Minglei;XUE Liang(College of Electronics and Information Engineering,Shanghai University of Electric Power,Shanghai 201306,China;College of Mathematics and Physics,Shanghai University of Electric Power,Shanghai 201306,China)

机构地区:[1]上海电力大学电子与信息工程学院,上海201306 [2]上海电力大学数理学院,上海201306

出  处:《无线电工程》2024年第2期312-318,共7页Radio Engineering

基  金:国家自然科学基金(62105196)。

摘  要:自然场景下的文本区域形状复杂多变,直接使用轮廓坐标描述文本区域会使得建模不充分,导致文本检测准确性低。针对自然场景下文本区域不规则的问题,提出了一种基于Deformable DETR的任意形状文本检测模型,不同于传统的直接预测轮廓点的方法,使用B-样条对文字区域进行建模使得文本轮廓平滑精确的同时减少了需要预测的参数。提出的文本检测模型无需手工设计锚点、区域建议等组件,极大地简化了模型设计并提高了通用性。提出的模型在无需额外数据集的情况下在任意形状文本数据集CTW1500和Total-Text上的平均精度(F值)分别达到了85.4%和85.0%,证明了模型的有效性。Text regions in natural scenes have complex and variable shape.Directly use contour coordinates to describe text regions will make the modeling inadequate and lead to low accuracy of text detection.To address the problem of irregular text regions in natural scenes,an arbitrary-shaped text detection model based on Deformable DETR is proposed.The model differs from the traditional method of directly predicting contour points by using B-Spline to make the text contour smoother and more accurate and reduces the number of predictable parameters at the same time.The proposed text detection model eliminates the need to manually design components such as anchor and region proposal.The model greatly simplifies the design and makes it more generalizable.The proposed model achieves F-measure of 85.4%and 85.0%on CTW1500 and Total-Text,which demonstrate the effectiveness of the model.

关 键 词:计算机视觉 自然场景文本检测 Deformable DETR B-样条 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象