最大熵和条件随机场模型相融合的藏文人名识别  被引量:22

A Hybrid Approach to Tibetan Person Name Identification by Maximum Entropy Model and Conditional Random Fields

在线阅读下载全文

作  者:加羊吉[1] 李亚超[1] 宗成庆[2] 于洪志[1] 

机构地区:[1]西北民族大学中国民族语言文字信息技术重点实验室,甘肃兰州730030 [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190

出  处:《中文信息学报》2014年第1期107-112,共6页Journal of Chinese Information Processing

基  金:国家自然基金重点项目(61032008);西北民族大学中央高校基本科研业务费专项资金资助项目(ycx12003);模式识别国家重点实验室开放课题(201001051)

摘  要:藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。Tibetan person name recognition is one of the most difficult tasks in the area of Tibetan information pro- cessing, with a direct impact on the precision of Tibetan word segmentation. Based on the analysis of wording rules and features of Tibetan names, this paper proposes a method combining maximum entropy and conditional random fields to identify Tibetan person names. The experiment shows that this approach works significant well reaching 93. 08% in Fl-measure.

关 键 词:藏文人名识别 最大熵 条件随机场 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象