面向中文微博的评价对象抽取方法研究  

The Extraction Method for Evaluation Object in Chinese Micro-Blog

在线阅读下载全文

作  者:鲁琳[1] 朱艳辉[1] 杜锐[1] 邓程[1] 梁韬[1] 

机构地区:[1]湖南工业大学计算机与通信学院,株洲412007

出  处:《科学技术与工程》2014年第12期223-226,261,共5页Science Technology and Engineering

基  金:国家自然科学基金(61170102);湖南省自然科学基金(10JJ3002);国家社会科学基金(12BYY045);湖南工业大学研究生创新基金(CX1313)资助

摘  要:微博作为当前互联网信息快速传播与分享的新平台,具有信息量庞大、评论多样等特点。针对微博评论信息中的评价对象抽取,采用组块分析和词语位置特征对训练集中3 000条微博观点句的评价对象序列标注,利用条件随机场学习并识别评价对象的名称、属性及其他辅助信息,通过修改相关参数达到最优识别效果,并提出针对复杂观点句评价对象的提取算法。实验结果表明,对测试集中7 000条微博观点句进行评价对象的名称和属性的抽取,效果较好。As the new platform of Internet information with rapidly spreading and sharing, micro-blog has the characteristics of large information content and diversity of reviews. According to evaluation object extraction in the micro-blog comments, using chunk parsing and terms' position feature to sequentially label the evaluation object of 3 000 micro-blog perspective sentences in train, using CRF to study and identify the name, properties, and other auxiliary information of the evaluation object, by modifying the relevant parameters to achievement optimal effect of discernment, a extraction algorithm for complex opinion sentences is put forward. Experimental results indicate that it is more effective to extract the name and attribute of evaluation object from 7 000 micro-blog perspective sentences in test.

关 键 词:中文微博 评价对象 组块模型 复杂观点句 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象