检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张子旭 游钰玮 仝明磊 薛亮 ZHANG Zixu;YOU Yuwei;TONG Minglei;XUE Liang(College of Electronics and Information Engineering,Shanghai University of Electric Power,Shanghai 201306,China;College of Mathematics and Physics,Shanghai University of Electric Power,Shanghai 201306,China)
机构地区:[1]上海电力大学电子与信息工程学院,上海201306 [2]上海电力大学数理学院,上海201306
出 处:《无线电工程》2024年第2期312-318,共7页Radio Engineering
基 金:国家自然科学基金(62105196)。
摘 要:自然场景下的文本区域形状复杂多变,直接使用轮廓坐标描述文本区域会使得建模不充分,导致文本检测准确性低。针对自然场景下文本区域不规则的问题,提出了一种基于Deformable DETR的任意形状文本检测模型,不同于传统的直接预测轮廓点的方法,使用B-样条对文字区域进行建模使得文本轮廓平滑精确的同时减少了需要预测的参数。提出的文本检测模型无需手工设计锚点、区域建议等组件,极大地简化了模型设计并提高了通用性。提出的模型在无需额外数据集的情况下在任意形状文本数据集CTW1500和Total-Text上的平均精度(F值)分别达到了85.4%和85.0%,证明了模型的有效性。Text regions in natural scenes have complex and variable shape.Directly use contour coordinates to describe text regions will make the modeling inadequate and lead to low accuracy of text detection.To address the problem of irregular text regions in natural scenes,an arbitrary-shaped text detection model based on Deformable DETR is proposed.The model differs from the traditional method of directly predicting contour points by using B-Spline to make the text contour smoother and more accurate and reduces the number of predictable parameters at the same time.The proposed text detection model eliminates the need to manually design components such as anchor and region proposal.The model greatly simplifies the design and makes it more generalizable.The proposed model achieves F-measure of 85.4%and 85.0%on CTW1500 and Total-Text,which demonstrate the effectiveness of the model.
关 键 词:计算机视觉 自然场景文本检测 Deformable DETR B-样条
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.211.44