检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:毋琳[1] 郑逢斌[1] 乔保军[1,2] 汤赛丽[1]
机构地区:[1]河南大学计算机与信息工程学院 [2]北京理工大学计算机学院,北京100081
出 处:《计算机工程与应用》2006年第14期180-182,232,共4页Computer Engineering and Applications
基 金:河南省科技厅科技攻关项目(编号:0424220146)
摘 要:论文介绍在HENU汉语自动分词系统中对中文人名的自动识别算法。该算法在常用的规则和统计相结合方法基础之上,采用了局部回溯分词的思想,较好地解决了同姓异名对的冲突问题。在开放测试中,该方法取得了90.9%的准确率和95.9%的召回率。This paper presents the technique about Chinese names recognition in HENU automatic Chinese segmenting system.Based on the rules of Chinese names boundary information and a large amount of statistical data extracted from large scale corpus,this algorithm adds a technique of local backtracked segmentation,which effectively solves the contradiction of the potential Chinese names' pair which have same surname,ended with different word.In opening experiment,the recall and precision of this algorithm reaches 95.9% and 90.9%.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.142.133.182