检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华中师范大学国家数字化学习工程技术研究中心,湖北武汉430079 [2]兴义民族师范学院信息技术学院,贵州兴义562400 [3]中建三局东方装饰设计工程有限公司,湖北武汉430035 [4]湖北大学信息与网络中心,湖北武汉430062
出 处:《软件导刊》2014年第11期28-30,共3页Software Guide
摘 要:在分析工程文本中命名实体实际特征的基础上,提出一种基于CRF与规则相结合的工程领域命名实体识别方法。在完善用户词典并对文本进行分词后,以短语级的粒度为原则从中确定特征,将文本交由CRF算法进行处理;分析CRF的处理结果,根据语言学规律及工程文本特点编写规则,对CRF处理结果进行优化。实验表明,该方法的全局F1值能够达到93.45。This article proposed a method of Named-Entity recognizing base on CRF and rules for civil engineering ,on the features of civil engineering text .First ,completed the word segmentation by using special dictionary ,then chose the fea-ture types of the text on the level of phrase ,thirdly processed by the CRF ,and got the preliminary result .For improving the result ,rules would be written ,which were bases on linguistics and the characteristic of the text .The result of experi-ment indicated that the F1 value of the method could reach to 93 .45 .
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.138.106.12