面向空中交通管制的时频域语音增强技术研究  被引量:1

Research on Time-Frequency Domain Speech Enhancement Techniques for Air Traffic Control

在线阅读下载全文

作  者:李煜琨 孔建国[1] 蒋培元 梁海军 LI Yu-kun;KONG Jian-guo;JIANG Pei-yuan;LIANG Hai-jun(Civil Aviation Flight University of China,Guanghan 618000,China)

机构地区:[1]中国民用航空飞行学院,四川广汉618000

出  处:《航空计算技术》2024年第3期32-37,共6页Aeronautical Computing Technique

基  金:国家重点研发计划项目资助(2021YFF0603904);中央高校基本科研业务费项目资助(PHD2023-035,ZHMH2022-009);四川省科技计划项目资助(2022YFG0210)。

摘  要:本研究旨在通过语音增强技术解决空中交通管制通话中的语音干扰问题。通过结合频域降噪和时域增强方法,提出了改进的U-Net模型实现了对管制语音的有效降噪处理。采用SNR(Signal-to-Noise Ration)、MOS(Mean Opinion Score)来直接评估降噪效果。实验结果显示,与基线U-Net模型相比,改进模型的SNR值提升了4.5663,达到了7.3861。鉴于在实际ATC工作环境中难以准确计算SNR,采用了间接评估方法,通过语音识别系统的识别结果来间接衡量模型在真实ATC环境下音频的降噪效果。实验结果表明,经过语音增强处理后的测试音频在语音识别系统中平均字错率降低了1.79%,句错率降低了3%,改进后的模型能有效改善话音质量提升语音识别系统的识别准确率。This study aims to solve the problem of voice interference in air traffic control communications using voice enhancement technology.By combining frequency domain noise reduction with time domain enhancement methods,this paper proposes an improved U-Net model for effective noise reduction in control voice communications.The noise reduction effectiveness is directly evaluated using SNR(Signal-to-Noise Ratio)and MOS(Mean Opinion Score).Experimental results show that the SNR value of the improved model increased by 4.5663 over the baseline U-Net model,reaching 7.3861.Given the difficulty of accurately calculating SNR in real ATC environments,this paper employs an indirect evaluation method,using the results of a speech recognition system to measure the model′s noise reduction effectiveness in actual ATC scenarios.The experimental results indicate that the test audio,after undergoing voice enhancement processing,show a reduction in the average word error rate by 1.79%and in the sentence error rate by 3%within the speech recognition system.The improved model effectively enhances voice quality and increases the accuracy of the speech recognition system.

关 键 词:语音增强 深度学习 U-Net ATC ASR 

分 类 号:V355[航空宇航科学与技术—人机与环境工程] TN912[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象