中文名实体识别中的特征组合与特征融合的比较  被引量:7

Comparing features combination with features fusion in Chinese named entity recognition

在线阅读下载全文

作  者:赵健[1] 王晓龙[1] 关毅[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001

出  处:《计算机应用》2005年第11期2647-2649,共3页journal of Computer Applications

基  金:国家自然科学基金资助项目(60435020);国家863计划项目(2002AA117010-09)

摘  要:先分析了最大熵模型常用的特征线性组合方法中的权值偏置问题,然后提出了在线性组合之前,对特征进行融合,并根据融合特征和目标类别之间的互信息选择有效复合特征的方法。通过在包含2000个人名的语料库上的测试,表明特征融合能有效地提高名实体识别的精度和召回率。Maximum entropy model is usually used for named entity recognition, in which the features related to a random event are linearly combined. The problem of the weight bias in the features combination was pointed out, and a strategy of performing features fusion before linearly combining was proposed. The result of experiment on corpus containing 2000 human names shows that features fusion can improve the precision and recall of named entity recognition effectively.

关 键 词:名实体识别 特征组合 权值偏置 特征融合 最大熵模型 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象