基于兴趣点简称的检索方法研究被引量：1

Study of Chinese Points of Interest Search Based on Name Abbreviations

机构地区：[1]北京大学遥感与地理信息研究所空间智能计算实验室,北京100871

出　　处：《太原理工大学学报》2008年第S1期52-55,共4页Journal of Taiyuan University of Technology

基　　金：国家重点研究基础发展规划(973)项目(2006CB70130000)

摘　　要：提出了一种基于统计方法和分词的匹配模型,该模型能够根据简称找出最可能的全称。这一模型由三个部分组成:针对不同类别的全称,对兴趣点全称进行分类,将全称划分成机构、公司、行业、区域和未知五类单词;把单词按照长度分为六类,然后在此基础上建立隐马尔可夫统计模型;在越频繁使用的全称越有可能产生简称的假设下,建立一个流行度统计模型。实验表明上述模型的首选准确率达到近85%,比现有搜索引擎的匹配能力有了显著的提高。This paper provides a model based on statistical methods and segmentation,which can retrieve the full name matching the abbreviation mostly.This model consists of three parts: The full names of POI were firstly segmented and the segments were classified as one of organizations,companies,industry,location or unknown;the segments were classified into 6 classes according to their length,then,hidden Markov model was built with respect to every class mentioned above;the more popular a POI name is,the more likely...

关键词：简称兴趣点名称匹配中文信息处理隐马尔科夫模型

分类号：TP391.3[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于兴趣点简称的检索方法研究被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于兴趣点简称的检索方法研究 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于兴趣点简称的检索方法研究被引量：1