检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙赫 李淑琴[2] 吕学强[1,2] 刘克会[3,4]
机构地区:[1]网络文化与数字传播北京市重点实验室,北京100101 [2]北京信息科技大学计算机学院,北京100101 [3]北京理工大学管理与经济学院,北京100081 [4]北京城市系统工程研究中心,北京100035
出 处:《山东大学学报(理学版)》2016年第3期77-85,共9页Journal of Shandong University(Natural Science)
基 金:国家自然科学基金资助项目(61271304);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037);北京市财政项目(PXM2014-17825-000005);网络文化与数字传播北京市重点实验室开放课题项目(ICDD2015)
摘 要:微博投诉文本中地理位置实体通常存在结构复杂,长度较长,描述较详细的特点。通过对投诉微博文本的分析,提出了地理位置实体自动识别的方法。该方法首先利用特征资源库对微博进行特征标注,使用条件随机场(conditional random fields,CRF)模型识别地理位置实体。其次根据微博和地理位置实体的特点,对CRF识别后的数据进行二次标注。最后利用微博规则库对识别结果进行补召,修正地理位置实体,最终实现地理位置实体的识别。实验结果表明该方法有显著效果,F值可达到85.52%。Geographical entity in city complaints of M icro-blog has usually has the characteristics of complicated structure,long length,the location of detailed description. This paper presents an automatic method to recognize geographical entities through analysis complaints of M icro-blog. First of all,the method utilizes the feature repository of M icroblog to mark features,using the conditional random field( CRF) model to identify the geographical entities. Second,according to the characteristics of M icro-blog and geographical entity,recognized data by CRF is second marked.Third,rule bank is utilized to supplementing the recognition result and correcting geographical entities,consequently,the recognition of geographical entities are implemented. At last,Experimental results on the proposed method proved to have an F-Score of 85. 52%.
关 键 词:微博城市投诉文本 地理位置实体识别 CRF 微博规则库
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222