检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京师范大学文学院,南京市宁海路122号210097 [2]南京师范大学虚拟地理环境教育部重点实验室,南京市文苑路1号210046
出 处:《武汉大学学报(信息科学版)》2010年第8期930-935,982,共7页Geomatics and Information Science of Wuhan University
基 金:国家863计划资助项目(2007AA12Z221);国家自然科学基金资助项目(40971231;60773173);国家社科基金资助项目(07BYY050)
摘 要:讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。This paper explores approaches for Toponym resolution in Chinese text,and proposes a geo-parsing approach based on conditional random fields and discourse toponym relations,and a geo-coding approach based on partial fuzzy matching and cognitive salience calculation.The proposed geo-parsing approach deals with the recognition of toponym in three major steps.The experiment shows that the key factors that may influence the performance of toponym resolution in Chinese text are the coverage of gazetteer,the performance of geo-parsing and the performance of semantic disambiguation of toponyms.In our experiment,there are about 17% toponyms can not locate their semantics in the gazetteer.Ambiguity in geo-parsing and geo-coding are the next prominent factors that affect the overall performance of toponym resolution.
分 类 号:P208[天文地球—地图制图学与地理信息工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.137.210.133