检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:兰义湧[1] 龙从军[2] 赵小兵 LAN Yi-yong1 , LONG Cong-jun2, ZHAO Xiao-bing3(1. School of science, Minzu University of China, Beijing 100081, China;2. The Institute of Ethnology and Anthropology, Chinese Academy of Social Sciences, Belting 100081, China ; 3. National Language Resource Monitoring & Research Center of Minority Languages, Beijing 100081 ,Chin)
机构地区:[1]中央民族大学理学院,北京100081 [2]中国社会科学院民族学与人类学研究所,北京100081 [3]国家语言资源监测与研究中心少数民族语言分中心,北京100081
出 处:《中央民族大学学报(自然科学版)》2018年第1期34-40,共7页Journal of Minzu University of China(Natural Sciences Edition)
基 金:国家语言文字委员会资助(项目名称少数民族语言调查数据管理与共享平台的构建No.ZDI135-7)
摘 要:本文首先分析了藏文人名的特点以及藏文人名识别的难点,在此基础上,利用条件随机场模型,分别提出了采用基于亚音节标注的藏文人名识别方法和分词与词性标注一体化的藏文人名识别方法.The features of the Tibetan names and the difficulty of Tibetan names recognition are analyzed. According to the features,we formulate different Tags sets,respectively based on the sub-syllable tagging method and the integration of word segmentation and POS tagging method,and carry out the training of recognition model of Tibetan names by adopting the CRFs.
关 键 词:藏文人名 条件随机场 亚音节 分词 词性标注 一体化
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15