DirectShow技术在音频格式转换及音视频分离方面的应用  被引量:3

在线阅读下载全文

作  者:徐燃[1] 潘接林[1] 

机构地区:[1]中国科学院声学研究所,北京100080

出  处:《计算机应用》2005年第B12期387-390,共4页journal of Computer Applications

摘  要:目前语音识别系统的输入都是线性PCM格式的音频文件,然而在实际应用中,需要识别各种格式音频文件以及视频流中的音频,在开始识别前,需要进行音频格式转换并从视频流中进行音频提取。因此,音频格式的转换和从视频中分离出音频信号已成为语音识别系统一种必需的预处理过程。文中介绍了一种将M icrosoft的D irectShow技术应用于W indows平台的多种压缩音频格式转换为W indows PCM WAV格式以及从多媒体视频中分离音频信号的方法,并分析了常见音频压缩编码格式经转换后对语音识别系统性能的影响。这对于语音识别技术在实际中的应用有着重要的意义。

关 键 词:DIRECTSHOW 语音识别 音频格式转换 音视频分离 

分 类 号:TP37[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象