检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南工学院计算机科学系,湖南衡阳421002
出 处:《计算技术与自动化》2009年第2期119-123,共5页Computing Technology and Automation
基 金:湖南省教育厅科研资助基金项目(07C032)
摘 要:利用可变长语言模型对中文文档的关键词进行准确识别是中文信息处理中的一个重要问题。由于不存在n元语言模型的截断效应,对关键词检索的长度没有限制,因此增加了关键词识别的难度。利用PAT-tree技术设计了一个改进的可变长统计语言模型对中文文档中的关键词进行识别。在该模型基础上进行相关性检测实验。实验结果表明基于PAT-tree的改进语言模型能更好的识别关键词。Ucilizing a vat - gram language model to detect precisely the keyword of Chinese document is a serious problem in Chinese Language processing. Without a truncation effect for n- gram language model, there is no length limit for the keyword retrieval, which increase the diffiulty of detecting the keyword. An impraved var- gram language model using PAT - tree to detect the keyword in Chinses document is designed and a mutal information estimation based on the model is made. The result shows that the PAT- tree- based improved language model can do better on detecting of the keyword.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.135.190.163