基于PAT-tree的中文关键词自动检索模式的研究  被引量:4

Pattern Research of Automatic Chinese Keyword Retrieval Based on PAT-tree

在线阅读下载全文

作  者:柳佳刚[1] 陈山[1] 

机构地区:[1]湖南工学院计算机科学系,湖南衡阳421002

出  处:《计算技术与自动化》2009年第2期119-123,共5页Computing Technology and Automation

基  金:湖南省教育厅科研资助基金项目(07C032)

摘  要:利用可变长语言模型对中文文档的关键词进行准确识别是中文信息处理中的一个重要问题。由于不存在n元语言模型的截断效应,对关键词检索的长度没有限制,因此增加了关键词识别的难度。利用PAT-tree技术设计了一个改进的可变长统计语言模型对中文文档中的关键词进行识别。在该模型基础上进行相关性检测实验。实验结果表明基于PAT-tree的改进语言模型能更好的识别关键词。Ucilizing a vat - gram language model to detect precisely the keyword of Chinese document is a serious problem in Chinese Language processing. Without a truncation effect for n- gram language model, there is no length limit for the keyword retrieval, which increase the diffiulty of detecting the keyword. An impraved var- gram language model using PAT - tree to detect the keyword in Chinses document is designed and a mutal information estimation based on the model is made. The result shows that the PAT- tree- based improved language model can do better on detecting of the keyword.

关 键 词:PAT—tree 信息检索 语言模型 交互信息 

分 类 号:G250.76[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象