国家自然科学基金(60572083)

作品数:9被引量:52H指数:5
导出分析报告
相关作者:刘加张卫强姚竞何珏陈恩庆更多>>
相关机构:清华大学郑州大学沈阳飞机设计研究所更多>>
相关期刊:《通信学报》《自然科学进展》《中文信息学报》《清华大学学报(自然科学版)》更多>>
相关主题:语音识别语音信号处理音频检索电话语音听感更多>>
相关领域:电子电信自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-9
视图:
排序:
基于听感知特征的语种识别被引量:21
《清华大学学报(自然科学版)》2009年第1期78-81,共4页张卫强 刘加 
国家自然科学基金资助项目(60572083);国家"八六三"高技术项目(2006AA010101;2007AA04Z223)
为了在语种识别时充分利用人的听感知特性提高识别性能,提出了一种基于听感知模型的特征。听感知特征采用Gammatone滤波器组代替常用的三角滤波器组计算语音信号各子带能量;根据等效矩形带宽模型,确定各滤波器的中心频率与带宽;使用反...
关键词:语音信号处理 语种识别 听感知特征 
嵌入式英语命令词语音识别算法研究被引量:1
《微计算机信息》2008年第17期4-5,8,共3页姚竞 王国梁 刘加 
国家自然生科学基金资助项目(60572083)
本文提出了一种基于定点DSP的嵌入式英语语音命令词识别算法,并基于TI芯片建立识别系统。系统采用基于连续隐Markov模型(Continuous Density Hidden Markov Model,CDHMM)的两阶段识别策略。通过决策树结合数据驱动的状态聚类方法,一阶...
关键词:语音识别 嵌入式 状态共享 特征选择 
一种基于仿生模式识别思想的固定音频检索方法被引量:7
《自然科学进展》2008年第7期808-813,共6页张卫强 刘加 陈恩庆 
国家自然科学基金(批准号:60572083);国家高技术研究发展计划(批准号:2006AA010101;2007AA04Z223)资助项目
固定音频检索是指在待检音频中检测和定位与给定查询音频同源的音频片段,它是多媒体检索中的基本问题之一.根据仿生模式识别的基本思想,将查询段映射为高维特征空间中的点,然后考虑各种同源情况对其进行扰动,形成一个超立方体覆盖.通过...
关键词:音频检索 仿生模式识别 高维空间点覆盖 
电话语音的多说话人分割聚类研究被引量:6
《清华大学学报(自然科学版)》2008年第4期574-577,共4页张薇 刘加 
国家自然科学基金资助项目(60572083);信息产业部信息安全计划项目
为了提高电话多人语音中提取的单人语音纯度,即多说话人分割聚类处理的性能,该文在传统的分步分割聚类算法机制上增加了重分割处理,提出逐级算法增强处理机制:在分割部分,该文提出了一种基于Bayesian信息准则的分割算法,融合基于不同距...
关键词:语音信号处理 电话语音 分割聚类 交叉似然比 进化隐Markov模型 
基于TMS320VC5507的语音识别系统实现被引量:2
《微计算机信息》2008年第2期168-170,共3页宋辉 姚竞 路向峰 刘加 
国家自然科学基金资助项目(60572083)
语音识别片上系统可以实现简单的人机交互和语音控制,在家电、玩具及各种人机交互系统中有着广泛的应用前景。本文结合汉语语音特点,在TMS320VC5507芯片上实现了高性能特定人与非特定人中小词汇量孤立词识别系统。采用基于循环缓冲区的...
关键词:特定人 非特定人 片上系统 德州仪器 直接存储访问 
网络音频数据检索技术被引量:10
《通信学报》2007年第12期152-155,共4页张卫强 刘加 
国家自然科学基金资助项目(60572083)~~
针对网络海量数据的应用特点,对传统的直方图算法进行了改进,采用基于主轴树的快速矢量量化技术进行预处理,采用两阶段法进行搜索处理,实验结果表明这2种方法可以显著提高检索的速度和精度。
关键词:音频检索 矢量量化 两阶段法 
电话语音双人检测算法
《清华大学学报(自然科学版)》2007年第1期65-68,共4页李科 刘加 
国家自然科学基金资助项目(60572083);信息产业部信息安全计划项目(2005C41)
为了提高两个说话人情况下电话语音双人检测的性能,提出了一种基于长时距离与短时距离之和的双人语音分段算法,并对分段过程中的聚类过程进行了改进。对于分段得到的语音采用基于GMM-UBM(Gaussian mixturemodel-universal background mo...
关键词:语音信号处理 说话人识别 聚类 通用似然比距离 
语音识别SoC UniLite的系统设计被引量:2
《计算机工程》2006年第21期197-199,共3页杨之佐 董明 刘加 刘润生 孙旭东 
国家自然科学基金资助项目(60572083)
UniLite系统以DSP为核心,集成了片内存储器、AD/DA通道和多种的输入输出端口,有效控制了系统的成本和功耗,在有限的RAM空间上实现了高性能非特定人语音识别以及语音编解码的功能。系统采用连续隐含马尔科夫(CHMM)算法,运用了分阶段提取...
关键词:嵌入式系统 语音识别 DSP SOC设计 
汉语连续语音中HMM模型状态数优化方法研究被引量:7
《中文信息学报》2006年第6期83-88,共6页何珏 刘加 
国家自然科学基金资助项目(NSFC)(60572083);信息产业部信息安全计划项目资助
为了优化汉语连续语音中HMM模型系统以提高识别性能,提出了分别为每个声母和韵母半音节声学模型选择最优的状态数的方法。通过综合考虑每个声母和韵母半音节声学模型在不同状态数下的段长均值、方差以及各自识别率这三者信息,作为进行...
关键词:计算机应用 中文信息处理 声学模型 隐型Markov模型 语音识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部