一种基于本体论和规则匹配的中文人名识别方法  被引量:5

Research on Chinese name identification based on Ontology and Rule matching

在线阅读下载全文

作  者:周昆[1] 胡学钢[1] 

机构地区:[1]合肥工业大学计算机与信息学院,安徽合肥230009

出  处:《微计算机信息》2010年第31期87-89,共3页Control & Automation

摘  要:未登录词识别是中文信息处理的一个难点,未登录词识别技术的突破对提高汉语自动分词和句法分析的准确性都有很重要的意义。在未登录词中,仅中文姓名就占15%之多,由此可见中文姓名识别对于未登录词识别乃至整个自动分词技术的重要性。本文设计了一种基于本体论和规则匹配的中文人名识别方法,首先基于本体构建中文人名层次分类体系,于分词的过程中指导源文本中候选人名的提取,然后根据规则库匹配修正候选人名,同时分析识别结果生成新的规则反馈给规则库。该方法能够对中文人名知识库进行有效的组织,同时具有一定的自学习的能力,可以获得比较好的中文人名识别效果。Identification of the unknown words in Chinese information processing is a hard nut to crack,the breakthroughs on the unknown word identification technology is very important to improve the accuracy of Chinese word segmentation and syntactic analysis. According to statistics,only the Chinese name account for as much as 15% of the unknown words. This shows the the importance of name recognition for Chinese unknown word identification as well as automatic segmentation.A method based on ontology and rule matching to identify Chinese names is proposed in this paper. Ontology-based Knowledge of the Chinese name is Constructed to guide the candidates recognition in the process of Chinese word segmentation. Then amend the Candidates according to rules system at the same time analyze the results to produce new rules and add them to rule system.

关 键 词:中文人名识别 命名实体识别 中文分词 本体 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象