搜索引擎用户查询中的复杂专有名词识别  被引量:3

Recognition of complex named-entities in user queries of search engine

在线阅读下载全文

作  者:胡学营[1] 刘慧[1] 陆汝占[1] 

机构地区:[1]上海交通大学计算机科学与工程系,上海200240

出  处:《计算机工程与应用》2008年第19期153-155,共3页Computer Engineering and Applications

摘  要:专有名词识别(Named-Entity Recognition,NER)是自然语言处理和信息检索的基础。现有的很多文献集中于人名、地名、机构名等的识别,很少涉及到书名和电影名等较为复杂的专有名词。专注于某搜索引擎的用户查询日志中出现的这类复杂专有名词的识别。根据用户的查询在网络中的上下文数据,将查询进行粗切分,并利用该网络数据作为训练语料训练复杂专名分类器。使用三种不同的分类器,证实该方法能取得相当好的效果。Named-Entity Recognition (NER) is a fundamental task for natural language processing and information retrieval. Literatures are full of person,location and organization names,while complex named-entities as book names and movies names are seldom refen'ed.The authors focus on the recognition of such complex named-entities in query logs of a search engine.The authors roughly segment the queries according to their Web context and use the Web data to train a complex named-entities classifier.The authors use three different classifiers,which show that the methods have fairly good performance.

关 键 词:专有名词识别 网络数据 决策表 切分 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象