基于规则的复句关系词的自动标识  被引量:4

Rule Based Identification of Compound Sentences Relation Words

在线阅读下载全文

作  者:贾遂民[1] 雷利利 胡明生[1] 

机构地区:[1]郑州师范学院信息科学与技术学院,河南郑州450044 [2]河南财经税务高等专科学校综合实验实训中心,河南郑州451464

出  处:《中文信息学报》2015年第1期44-48,66,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金(U1204703);中央高校基本科研业务费资助(HUST:2012QN087;2012QN088);河南省重点科技攻关项目(122102310004);郑州市创新型科技人才队伍建设工程(10LJRC190)

摘  要:关系词的自动标识是中文信息处理领域的基础性研究课题,该文利用规则实现其自动标识。首先通过语料的分析总结出关系词在使用过程中的12种特征,以这些特征建立规则的约束条件;然后提出包含匹配算法实现复句准关系词序列与规则索引词的匹配,以此获取目标规则,并根据目标规则约束条件与关系词所在语境的匹配结果得到匹配规则;最后利用匹配规则的结论实现关系词的自动标识。实验结果表明,该方法对关系词标识的正确率达到70.9%。Automatic identifying the relation words of compound sentences is a fundamental issue in the field of Chi- nese information processing. This paper describe a rule based method for automatic identification of compound sen- tence relation words. To construct the rule, 12 featuresare summarized from the corpus. Then a match algorithm is described to obtaind the candidate relation word sequence. Finally the context of the relation words is employed to match with the rules. Experiment results show that this method achieves an accuracy of 70.9%.

关 键 词:关系词 规则 复句 自动标识 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象