检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朱彦斌 王润民 陈华 曹小菲 朱祯琳 丁亚军 ZHU Yanbin;WANG Runmin;CHEN Hua;CAO Xiaofei;ZHU Zhenlin;DING Yajun(School of Information Science and Engineering,Hunan Normal University,Changsha 410081,Hunan,China)
机构地区:[1]湖南师范大学信息科学与工程学院,湖南长沙410081
出 处:《计算机工程》2024年第11期80-88,共9页Computer Engineering
基 金:湖南省自然科学基金面上项目(2020JJ4057);湖南省教育厅重点基金(21A0052);长沙市重点研发计划(kq2004050)。
摘 要:深度学习极大地推动了自然场景文本检测和识别领域的发展,然而,对行车环境中的交通文本检测研究相对匮乏。为此,提出一种新颖的端到端文本检测框架,实现对车载摄像头捕获到的交通文本检测。设计多粒度文本特征增强模块(MTFEM),通过无缝集成交通文本的粗粒度特征和细粒度特征,进行全面理解和分析,以提高对交通文本的特征表达能力。此外,为了优化网络学习,保持模型训练的稳定性,避免像素预测误差所导致梯度急剧变化,设计一种新颖的联合损失函数。实验结果表明,该方法在交通文本数据集CTST-1600和TPD上的F1值分别达到了93.7%和94.1%,与主流方法相比具有更高的检测结果。为了进一步验证所提方法的适应性,在多方向自然场景文本数据集ICDAR 2015和多语言文本数据集MSRA-TD500上的F1值分别取得了87.7%和87.0%,具有较强的鲁棒性。Deep learning has significantly advanced the field of natural scene text detection and recognition.However,research on traffic text detection in driving environments remains relatively lacking.This study proposes a novel end-to-end text detection framework to effectively detect traffic text captured by in-vehicle cameras.First,a Multi-granularity Text Feature Enhancement Module(MTFEM)is designed to improve the feature representation of traffic text by seamlessly integrating coarse-and fine-grained features of traffic text.In addition,a novel joint loss function is designed to optimize network learning,maintain the stability of model training,and avoid problems such as sharp gradient changes caused by pixel prediction errors.The experimental results indicate that this method achieves F1 values of 93.7%and 94.1%on the CTST-1600 and TPD traffic text datasets,respectively,and has higher detection results compared with mainstream methods.To further validate the adaptability of the proposed method,F1 values of 87.7%and 87.0%are achieved on the multi-directional natural scene text dataset ICDAR 2015 and multilingual text dataset MSRA-TD500,respectively,demonstrating strong robustness.
关 键 词:卷积神经网络 文本检测 智慧交通 多粒度特征增强 联合损失函数
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249