基于隐马尔可夫模型的音频自动分类  被引量:47

Automatic Audio Classification by Using Hidden Markov Model

在线阅读下载全文

作  者:卢坚[1,2] 陈毅松[1,2] 孙正兴[1,2] 张福炎[1,2] 

机构地区:[1]南京大学计算机科学与技术系,江苏南京210093 [2]南京大学计算机软件新技术国家重点实验室,江苏南京210093

出  处:《软件学报》2002年第8期1593-1597,共5页Journal of Software

基  金:~~国家自然科学基金资助项目(69903006;60073030)

摘  要:音频的自动分类,尤其是语音和音乐的分类,是提取音频结构和内容语义的重要手段之一,它在基于内容的音频检索、视频的检索和摘要以及语音文档检索等领域都有重大的应用价值.由于隐马尔可夫模型能够很好地刻画音频信号的时间统计特性,因此,提出一种基于隐马尔可夫模型的音频分类算法,用于语音、音乐以及它们的混合声音的分类.实验结果表明,隐马尔可夫模型的音频分类性能较好,最优分类精度达到90.28%.As one of the key methods to extract content semantics and structure from audio, automatic audio classification, especially for a speech and a music, is valuable for content-based audio retrieval, video summary and retrieval, and spoken document retrieval, etc. Because hidden Markov model (HMM) can well model audio signal抯 time statistical properties, a left-right discrete HMM is proposed to classify a speech, a music and their mixed audio. The experimental results show that HMM is excellent for audio classification, and the optimal classification accuracy is up to 90.28%.

关 键 词:隐马尔可夫模型 音频自动分类 向量量化 MFCC 语音信号处理 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象