基于语料库的蒙古人名知识库建设与实践  

在线阅读下载全文

作  者:通拉嘎[1] 刘凯[2] 李佳正 

机构地区:[1]泉州师范学院图书馆,福建泉州362000 [2]中国科学院计算技术研究所,北京100190 [3]中国移动北京分公司,北京100007

出  处:《图书馆理论与实践》2015年第2期109-112,共4页Library Theory and Practice

基  金:国家自然科学基金重点项目"跨语言社会舆情分析基础理论与关键技术"(项目编号:61331013)的系列成果之一

摘  要:为提取较为完备的蒙古人名特征,以内蒙古大学语料库及网页人名句为基础,采用量化分析的方法,建立普通人名知识库及兼类人名知识库,将知识库归并为14个特征,进行特征选择实验,在直接保留"汉语姓氏映射表"及"汉语人名映射表"等特征集后,鉴于对正确率和召回率的贡献,去除了地名词典、地名后缀词典、机构名后缀词典等3个特征集,保留了9个作为最大熵模型的特征集,从实验结果看,予以保留的特征影响并不相同。

关 键 词:语料库 人名 蒙古人名 最大熵 特征选择 实验 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] G250.74[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象