典型多说话人语音自动分割算法研究  

Research on Automatic Segmentation Algorithm of Typical Multi-speaker Speech

在线阅读下载全文

作  者:陆思宇 姜囡 

机构地区:[1]中国刑事警察学院 [2]证据科学教育部重点实验室(中国政法大学)

出  处:《警察技术》2024年第2期35-38,共4页Police Technology

基  金:公安学科基础理论研究创新计划项目(编号:2022XKGJ0110);辽宁省科技厅联合开放基金机器人学国家重点实验室开放基金资助项目(编号:2020-KF-12-11);证据科学教育部重点实验室开放基金资助课题(编号:2021KFKT09);中央高校基本科研业务费专项资金资助(编号:3242019010);辽宁省自然科学基金项目(编号:2019-ZD-0168);教育部重点研究项目(编号:E-AQGABQ20202710)。

摘  要:针对多说话人涉案语音的检验处理,常需要人工将多说话人语音分为若干个单一说话人语音片段,逐一在长时语音段中寻找语音分割点,从而严重影响检验人员的工作效率。利用说话人语音分割技术可以自动高效寻找出语音段中目标说话人语音转换点,有效提升办案时效。分别选取BIC分割算法、基于Ecapa-tdnn声纹模型的左右窗分割算法、基于Bi-lstm的二分类窗分割算法以及固定窗分割算法,针对不同种类噪声的含噪语音进行语音自动分割的差异性分析。结果表明,左右窗和二分类窗分割算法具有良好的分割准确性和抗噪性,BIC和固定窗的非监督式分割算法在处理速度上具有明显优势。本文的分析结果可为多说话人涉案语音预处理方法选择上提供有效的数据和理论依据。

关 键 词:说话人语音分割 语音预处理 低信噪比 贝叶斯准则 声纹模型 

分 类 号:TN912.3[电子电信—通信与信息系统] D918.2[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象