检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:罗明[1,2] 黄海量[1,2] Luo Minga b Huang Hailianga(a. College oflnformation Management & Engineering, b. Shanghai Key Laboratory of Financial Information Technology, Shanghai University of Finance & Economic, Shanghai 200433, Chin)
机构地区:[1]上海财经大学信息管理与工程学院,上海200433 [2]上海财经大学上海市金融信息技术研究重点实验室,上海200433
出 处:《计算机应用研究》2016年第12期3691-3695,共5页Application Research of Computers
基 金:上海市科技创新行动计划项目(13511505200);上海市科技人才计划项目(14XD1421000);上海财经大学2014年研究生创新基金资助项目(CXJJ-2014-438);上海科学技术委员会资助项目(13DZ0510600)
摘 要:由于中文的内涵多义性和形式多样性的特点,使中文地址长期以来存在着难以标准化的问题,对进一步开展地址定位、区域网格分析和社情、舆情定位等工作都造成了较大的障碍。针对这个问题提出了基于地址分级模型和有限状态机驱动的新方法,并通过软件开发对这种方法的地址识别率和匹配准确率进行了验证,实验结果显示该方法对中文地址能够达到96%左右的识别率,匹配准确率也达到了85%左右,并且还能实现标准地址库的自动化更新。因此,采取该方法能够有效地解决中文地址标准化困难的问题,具有显著的实用性和研究参考价值。Because ambiguity and diversity are always existed in Chinese,these lead it to be a hard work in Chinese address standardization for a long time, and caused a huge difficulty in further carry out precise locating, geographic grid analysis and social situation and public sentiment locate. In order to solve this problem, this paper proposed a new method of Chinese address standardization, which based on address gradation and finite state machine theory. It verified the recognition ratio and correctly matching ratio of this method by software developing work. The experiment shows that this method can achieve more than 96% of recognition ratio, and more than 85 % matching ratio, it also can realize automatic stand address updating work. So this new method can solve the difficult problem in Chinese address standardization domain, and has a significant practical value and research reference value.
关 键 词:中文地址 地址编码 地址标准化 地址分级模型 地址匹配 有限状态机
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.56