检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100080
出 处:《中文信息学报》2006年第3期99-104,共6页Journal of Chinese Information Processing
基 金:国家高科技发展计划"863"资助项目(2005AA114070)
摘 要:对海量语音进行基于内容的检索需要语音识别技术和检索技术的结合。本文通过调节语言模型的途径研究在不同识别率的语音识别文本上进行关键词检索的差异,由此研究语音识别性能和检索性能之间的关联性。通过对114小时语音数据的实验表明:语音识别性能与检索性能有一定的相关性,同时也说明改进检索的方法可以消除一部分由于语音识别所带来的误差。研究结果为进一步针对性地改进识别引擎、语音识别输出的表示和相应的快速检索方法提供了基础。It is a paradigm to integrate speech recognition and information retrieval techniques to implement contentbased retrieval in mass speech data. The paper studies the relationship between speech recognition performance and retrieval performance, through analyzing the differences of keywords retrieval in the recognition documents with different recognition rates, which are adjusted by the language models. The experiment on 114 hours speech data indicates: speech recognition performance has some correlation with retrieval performance, and illuminates that improving the retrieval method can eliminate some speech recognition errors. The result provides the basis for further advancements in speech recognition engine, speech recognition results representation and rapid retrieval method.
关 键 词:计算机应用 中文信息处理 语音识别 关键词检索 查全率 查准率
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15