基于模式匹配与半监督学习的评价对象抽取  被引量:4

Comment Object Extraction Based on Pattern Matching and Semi-supervised Learning

在线阅读下载全文

作  者:宋晖[1] 史南胜[1] 

机构地区:[1]东华大学计算机科学与技术学院,上海201620

出  处:《计算机工程》2013年第10期221-226,共6页Computer Engineering

摘  要:针对产品评论中评价对象的抽取问题,提出一种基于模式匹配与半监督学习的抽取方法。通过大量样本统计,获得种子规则集,以抽取有效评价句,利用句法结构组合以及词性距离相关性算法抽取评价对象,将种子规则和评价对象存入相应的模式库,并通过半监督学习方法与规则的动态替换,进行规则的学习与评价对象的扩充训练。实验结果表明,该方法的抽取效果较好,证明了方法的可行性。This paper presents an extraction method based on pattern matching and semi-supervised learning on product comment targets. This method gets seed rules set through making statistics on a large number samples to extract the effective evaluation sentences, and extracts accurate opinion targets through the combination of syntactic structures and the Part of Speech(POS)-distance Correlation Algorithrn(PCA). Seed rules and opinion targets are stored in the corresponding pattern libraries, the training and expansion of the learning of rules and opinion targets is carried out by the semi-supervised learning methods and rules of dynamic replacement. Experimental results exhibit measurable improvement, and prove the feasibility of this method.

关 键 词:评价对象 意见挖掘 词性搭配 词性距离相关性算法 模式匹配 有效评价句 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象