融入多特征的汉越新闻观点句抽取方法  被引量:4

Chinese-Vietnamese News Perspective Sentence Extraction Methods Incorporating Multiple Features

在线阅读下载全文

作  者:林思琦 余正涛[1] 郭军军 高盛祥[1] LIN Siqi;YU Zhengtao;GUO Junjun;GAO Shengxiang(School of Information Engineering and Automation,Kunming University of Science and Technology,Kunming,Yunnan 650504,China)

机构地区:[1]昆明理工大学信息工程与自动化学院

出  处:《中文信息学报》2019年第11期101-106,共6页Journal of Chinese Information Processing

基  金:国家重点研发计划(2018YFC0830105,2018YFC0830100);国家自然科学基金(61732005,61672271,61761026,61762056,61866020);云南省高新技术产业专项(201606);云南省自然科学基金(2018FB104);云南省科技人才培养项目(KKSY201703015)

摘  要:该文提出一种融入多特征的汉越双语新闻观点句抽取方法。首先针对汉语和越南语标记资源不平衡的问题,构建了汉越双语词嵌入模型,用丰富的中文标记资源来弥补越南语标记资源的缺失。并且该文认为句子的主题特征、位置特征和情感特征对观点句分类具有重要作用,因此将这些特征分别融入词向量和注意力机制中,实现句子语义信息和情感、主题、位置特征的结合。实验表明,该方法可有效提升越南语新闻观点句抽取的准确率。This paper proposes a Chinese-Vietnamese bilingual news perspective sentence extraction method that incorporates multiple features.Firstly,for the problem of unbalanced resources in Chinese and Vietnamese,this method constructs a Chinese-Vietnamese bilingual word embedding model.We use rich Chinese tag resources to make up for the lack of Vietnamese tagging resources.Then,the emotional,topical and positional features of sentences are integrated into the word vector and attention mechanism respectively.Experiments show that this method can effectively improve the accuracy of Vietnamese news perspective sentence extraction.

关 键 词:观点句抽取 双语词嵌入 注意力机制 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象