一种有效解决汉语歧义切分的方法  被引量:1

Effective method on resolving Chinese ambiguous segmentation

在线阅读下载全文

作  者:朱鉴[1] 张建[1] 李淼[1] 

机构地区:[1]中国科学院合肥智能机械研究所

出  处:《计算机工程与应用》2007年第11期175-177,共3页Computer Engineering and Applications

基  金:中国科学院知识创新工程重要方向项目(No.KGCX2-SW-511)。

摘  要:提出了一种通过有向图和统计加规则的多层过滤方法来有效解决汉语分词过程中的交集型歧义切分问题,该方法大大提高了切分的正确率。经过65000字的开放语料测试,统计了其对交集型歧义字段的切分结果,发现该方法对交集型歧义字段的切分正确率为98.43%,以上数据表明该方法在解决汉语交集型歧义字段的问题时是行之有效的。This paper presents a method that is based on directed graph plus statistic-based and rule-based means,this method effectively resolves the Chinese overlapped ambiguous segmentation.In an open test of a Chinese corpus with 65 000 characters, the accuracy of segmentation for ambiguous phrases of overlapped type reaches 98.43% ,this number proves that this method is very effective on resolving Chinese overlapped ambiguous segmentation.

关 键 词:有向图 统计模型 规则库 歧义字段 汉字切分 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象