微博城市投诉文本中的地理位置实体识别  被引量:2

Recognition of geographical entity in city complaints of Micro-blog

在线阅读下载全文

作  者:孙赫 李淑琴[2] 吕学强[1,2] 刘克会[3,4] 

机构地区:[1]网络文化与数字传播北京市重点实验室,北京100101 [2]北京信息科技大学计算机学院,北京100101 [3]北京理工大学管理与经济学院,北京100081 [4]北京城市系统工程研究中心,北京100035

出  处:《山东大学学报(理学版)》2016年第3期77-85,共9页Journal of Shandong University(Natural Science)

基  金:国家自然科学基金资助项目(61271304);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037);北京市财政项目(PXM2014-17825-000005);网络文化与数字传播北京市重点实验室开放课题项目(ICDD2015)

摘  要:微博投诉文本中地理位置实体通常存在结构复杂,长度较长,描述较详细的特点。通过对投诉微博文本的分析,提出了地理位置实体自动识别的方法。该方法首先利用特征资源库对微博进行特征标注,使用条件随机场(conditional random fields,CRF)模型识别地理位置实体。其次根据微博和地理位置实体的特点,对CRF识别后的数据进行二次标注。最后利用微博规则库对识别结果进行补召,修正地理位置实体,最终实现地理位置实体的识别。实验结果表明该方法有显著效果,F值可达到85.52%。Geographical entity in city complaints of M icro-blog has usually has the characteristics of complicated structure,long length,the location of detailed description. This paper presents an automatic method to recognize geographical entities through analysis complaints of M icro-blog. First of all,the method utilizes the feature repository of M icroblog to mark features,using the conditional random field( CRF) model to identify the geographical entities. Second,according to the characteristics of M icro-blog and geographical entity,recognized data by CRF is second marked.Third,rule bank is utilized to supplementing the recognition result and correcting geographical entities,consequently,the recognition of geographical entities are implemented. At last,Experimental results on the proposed method proved to have an F-Score of 85. 52%.

关 键 词:微博城市投诉文本 地理位置实体识别 CRF 微博规则库 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象