检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京化工大学信息科学与技术学院,北京100029 [2]中国科学院自动化研究所,北京100190
出 处:《北京化工大学学报(自然科学版)》2016年第1期98-103,共6页Journal of Beijing University of Chemical Technology(Natural Science Edition)
基 金:国家科技支撑计划(2012BAH88F02)
摘 要:为了实现中文医药领域症状信息的自动化抽取,提出了一种基于条件随机场的拆分症状文本特征的抽取方法,将症状文本自动识别拆分为症状主体和症状表现形式自动识别两个部分,再将这两种识别结果作为特征加入到症状信息抽取过程中。信息抽取的结果包含完整的症状信息二元组:症状主体和症状表现形式。实验表明,该方法在症状信息抽取的准确率及查全率上有较大提升。In order to achieve the automated extraction of Chinese language symptom information, we put forward an extraction approach of splitting text features of symptoms based on CRF. The approach splits symptom tests into symptom subject recognition and symptom manifestation recognition, and then uses the results in the extraction of symptoms. The final results include complete two-tuples: symptom subject, symptom manifestation. Our experi- ments show that this approach can achieve a higher recognition rate than other methods.
关 键 词:命名实体识别 条件随机场 隐马尔科夫模型 症状抽取
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30