检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:于翠萍 YU Cui-ping(School of Clothing and Textile,Eastern Liaoning University,Dandong 118003,China)
机构地区:[1]辽东学院服装与纺织学院,辽宁丹东118003
出 处:《辽东学院学报(自然科学版)》2022年第3期199-204,共6页Journal of Eastern Liaoning University:Natural Science Edition
摘 要:针对中文文本,通过引入语言学相关知识,分析了强定位地名和弱定位地名的用词特征和上下文特征,提取形式化的规则。此外,提出一种基于条件随机场的弱定位地名识别方法,将弱定位地名识别问题转化为序列标注问题。以150篇共18万字的新浪网新闻页面文本为例进行实验验证,结果表明,提出的方法能够有效识别弱定位地名,召回率为90.57%,准确率为92.36%,F值为91.46%。By introducing linguistic knowledge,the author analyzed the word features and context features of strong and weak location names of Chinese text,and extracted formal rules.In addition,a weak location name recognition method based on conditional random field was proposed,which transformed the problem of weak location name recognition into sequence labeling problem.An experimental verification was carried out by taking 150 Sina news pages with 180000 words as an example.The results show that the proposed method can effectively identify weak location names,and the recall rate is 90.57%,the accuracy rate is 92.36%,and the F value is 91.46%.
分 类 号:P208[天文地球—地图制图学与地理信息工程] TP381[天文地球—测绘科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13