检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
出 处:《计算机应用》2005年第11期2647-2649,共3页journal of Computer Applications
基 金:国家自然科学基金资助项目(60435020);国家863计划项目(2002AA117010-09)
摘 要:先分析了最大熵模型常用的特征线性组合方法中的权值偏置问题,然后提出了在线性组合之前,对特征进行融合,并根据融合特征和目标类别之间的互信息选择有效复合特征的方法。通过在包含2000个人名的语料库上的测试,表明特征融合能有效地提高名实体识别的精度和召回率。Maximum entropy model is usually used for named entity recognition, in which the features related to a random event are linearly combined. The problem of the weight bias in the features combination was pointed out, and a strategy of performing features fusion before linearly combining was proposed. The result of experiment on corpus containing 2000 human names shows that features fusion can improve the precision and recall of named entity recognition effectively.
关 键 词:名实体识别 特征组合 权值偏置 特征融合 最大熵模型
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.143.7.75