检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京师范大学虚拟地理环境教育部重点实验室,南京210046
出 处:《计算机工程与应用》2010年第13期129-131,共3页Computer Engineering and Applications
基 金:国家自然科学基金No.40971231~~
摘 要:由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文地址要素识别方法。实验证明,与基于特征字的规则方法相比,基于条件随机场的方法能够在较大程度上提高识别效果。由于条件随机场模型具有较好的泛化能力,该方法具有更强的通用性,特别适宜于大规模地址数据的批量解析和大众化位置服务中地址编码的快速处理。Because of the nonstandard named Chinese address and description character of Chinese language,recognition of Chinese address elements has been regarded as key issues of Chinese geocoding.It is difficult to resolve the problem of address name diversity by traditional method of character words matching and dictionary or gazetteer matching.Chinese address recognition method on the basis of CRFs is designed by constructing address annotation set using NLP technology.The experiment proves that CRFs based method is better than character based rule method in recognition result.As CRFs model has good generalization ability,this method has greater generality that especially fits for large-scale batch parsing and quick geocoding in LBS.
关 键 词:地址编码 中文地址要素 自然语言处理 条件随机场
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.190.49