检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张剑 吴青 羊昕旖 王彬聪 吴宣为[1] 徐向英[1] 吕强[1]
出 处:《计算机与现代化》2018年第1期123-126,共4页Computer and Modernization
基 金:国家自然科学基金青年基金资助项目(61502412);江苏省自然科学基金青年基金资助项目(BK20150459);扬州大学生科技创新基金资助项目(X20160418)
摘 要:为满足农业命名实体领域中多样而精确的需求,本文采用基于条件随机场的命名实体识别,将农业命名实体分为病虫害、作物、化肥及农药4种命名实体,并用自定义标注集对其进行标注,以ICTCLAS分词系统来对收集到的语料进行分词,通过添加多种不同的特征以提高识别率。最终训练得到的模型对各命名实体识别的准确率达到了93%以上,召回率达到了84%以上,证明对农业命名实体细致划分为多个实体是可行的。To meet the requirement of diversification,the paper introduces named entities model based on conditional random fields,divides agricultural named entities into 4 classes,which are diseases and pests,crops,chemical fertilizer,pesticide and annotates. These entities are labeled with custom annotation set. It is segmented collected corpus with ICTCLAS segment system and added features to raise the recognition rate. Ultimately,the accuracy rate reaches over 93% and the recalling rate reaches over 84%. This result confirms that recognizing multiple entities after classifying them is feasible.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7