大词汇量连续语音声像情报处理系统框架  被引量:2

System Framework for Large Vocabulary Continuous Speech Multimedia Intelligence Processing

在线阅读下载全文

作  者:朱双华[1] 金鑫[2] 朱立新[1] 

机构地区:[1]信息系统工程重点实验室,南京210007 [2]南京航空航天大学信息科学与技术学院,南京210016

出  处:《指挥信息系统与技术》2012年第1期20-24,共5页Command Information System and Technology

基  金:总装"十一五"预研课题资助项目

摘  要:分析了声像情报的自动标注与检索的研究概况及其关键技术,提出了声像情报的自动化处理框架以及基于语音内容的情报服务方案,讨论了声像情报特征提取、索引和分析过程中采用的主要情报内容特征。该方案在普通话广播语音和电话语音等数据测试中,准确率均在92%以上。The automatic annotation and the retrieval of multimedia intelligence require large vo- cabulary speech recognition, natural language processing and information retrieval technologies. The automatic annotation and the retrieval of multimedia intelligence are studied and key tech- niques are analyzed. Then, a framework for multimedia intelligence automatic annotation and service is proposed. The main characteristics of speech recognition, speech indexing and intelli- gence analysis are investigated. The news broadcast and telephone audio data for annotation and retrieval are tested. Testing results show that the accuracy rate of the method is over 92%.

关 键 词:声像情报 语音识别 情报检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象