基于语境信息的组合型分词歧义消解方法  被引量:10

Context-based Approach to Covering Ambiguity Resolution in Chinese Word Segmentation

在线阅读下载全文

作  者:曲维光[1] 吉根林[2] 穗志方[1] 周俊生[2] 

机构地区:[1]北京大学计算语言学研究所,北京100871 [2]南京师范大学计算机系,南京210097

出  处:《计算机工程》2006年第17期74-76,共3页Computer Engineering

基  金:国家"973"计划基金资助项目(2004CB318102);国家自然科学基金资助项目(60503071);江苏省自然科学基金资助项目(BK2005135)

摘  要:提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧义进行实验,平均准确率达到95%以上,证明该方法对于消解组合型分词歧义具有良好效果。The concept of relative word frequency (RWF) is proposed. A context calculation model is set up, which makes use of contextual information to resolute covering ambiguity in Chinese word segmentation. This paper selects 5 frequently used covering ambiguous words as examples, and the results show that the average accuracy is over 95%.

关 键 词:中文自动分词 组合型歧义 相对词频 语境计算模型 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象