检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西北大学信息科学与技术学院,西安710127
出 处:《计算机工程》2012年第12期179-181,共3页Computer Engineering
基 金:陕西省自然科学基础研究计划基金资助项目(2010JM8031)
摘 要:针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网对提取的实例进行可用规则提取,结合规则和实例对文本进行人名识别。实验结果表明,与其他方法相比,该方法的中文人名识别准确率、召回率和F值均有明显提高。After comparing the advantage and weakness of the statistical methods and the rule methods,an automatic method for the recognition of Chinese personal name based on both Transformation-based Error-driven Learning(TBL) approach and HowNet is presented.Using label corpus,the contexts of the names are tagged with different roles according to their functions in the recognition of Chinese personal name,and distilling the instances labeled by role tagging,combined with the TBL method and HowNet to distill the fit regulation.Rules and instances are assembled together to recognize personal name in the texts.Experimental results show that the combined method is more effective in Chinese name identification with high precision,recall rate and F value.
关 键 词:中文人名识别 基于转换的错误驱动学习 知网 语料库 角色标注
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:52.14.244.195