基于条件随机场的农业命名实体识别  被引量:12

Chinese Agricultural Named Entity Recognition Based on Conditional Random Fields

在线阅读下载全文

作  者:张剑 吴青 羊昕旖 王彬聪 吴宣为[1] 徐向英[1] 吕强[1] 

机构地区:[1]扬州大学信息工程学院,江苏扬州225000

出  处:《计算机与现代化》2018年第1期123-126,共4页Computer and Modernization

基  金:国家自然科学基金青年基金资助项目(61502412);江苏省自然科学基金青年基金资助项目(BK20150459);扬州大学生科技创新基金资助项目(X20160418)

摘  要:为满足农业命名实体领域中多样而精确的需求,本文采用基于条件随机场的命名实体识别,将农业命名实体分为病虫害、作物、化肥及农药4种命名实体,并用自定义标注集对其进行标注,以ICTCLAS分词系统来对收集到的语料进行分词,通过添加多种不同的特征以提高识别率。最终训练得到的模型对各命名实体识别的准确率达到了93%以上,召回率达到了84%以上,证明对农业命名实体细致划分为多个实体是可行的。To meet the requirement of diversification,the paper introduces named entities model based on conditional random fields,divides agricultural named entities into 4 classes,which are diseases and pests,crops,chemical fertilizer,pesticide and annotates. These entities are labeled with custom annotation set. It is segmented collected corpus with ICTCLAS segment system and added features to raise the recognition rate. Ultimately,the accuracy rate reaches over 93% and the recalling rate reaches over 84%. This result confirms that recognizing multiple entities after classifying them is feasible.

关 键 词:中文命名实体识别 条件随机场 农业 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象