基于条件随机场的藏文人名识别研究  被引量:2

Tibetan Names Recognition Research Based on CRFs

在线阅读下载全文

作  者:兰义湧[1] 龙从军[2] 赵小兵 LAN Yi-yong1 , LONG Cong-jun2, ZHAO Xiao-bing3(1. School of science, Minzu University of China, Beijing 100081, China;2. The Institute of Ethnology and Anthropology, Chinese Academy of Social Sciences, Belting 100081, China ; 3. National Language Resource Monitoring & Research Center of Minority Languages, Beijing 100081 ,Chin)

机构地区:[1]中央民族大学理学院,北京100081 [2]中国社会科学院民族学与人类学研究所,北京100081 [3]国家语言资源监测与研究中心少数民族语言分中心,北京100081

出  处:《中央民族大学学报(自然科学版)》2018年第1期34-40,共7页Journal of Minzu University of China(Natural Sciences Edition)

基  金:国家语言文字委员会资助(项目名称少数民族语言调查数据管理与共享平台的构建No.ZDI135-7)

摘  要:本文首先分析了藏文人名的特点以及藏文人名识别的难点,在此基础上,利用条件随机场模型,分别提出了采用基于亚音节标注的藏文人名识别方法和分词与词性标注一体化的藏文人名识别方法.The features of the Tibetan names and the difficulty of Tibetan names recognition are analyzed. According to the features,we formulate different Tags sets,respectively based on the sub-syllable tagging method and the integration of word segmentation and POS tagging method,and carry out the training of recognition model of Tibetan names by adopting the CRFs.

关 键 词:藏文人名 条件随机场 亚音节 分词 词性标注 一体化 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象