检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:车蕾[1,2] 杨小平 王良[1] 梁天新[1] 韩镇远 CHE Lei;YANG Xiaoping;WANG Liang;LIANG Tianxin;HAN Zhenyuan(School of Information,Renmin University of China,Beijing 100872,China;School of Information Management,Beijing Information Science & Technology University,Beijing 100192,China)
机构地区:[1]中国人民大学信息学院,北京100872 [2]北京科技大学信息管理学院,北京100192
出 处:《中文信息学报》2019年第5期93-102,112,共11页Journal of Chinese Information Processing
基 金:北京市教委社科计划(SM201911232003);国家自然科学基金(61572079);北京市教委科技计划(KM201711417004)
摘 要:针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN)。文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组织结构包括字—词语—句层次。TSOHHAN模型采用竞争机制融合标题和正文以增强文本逻辑结构特征在话题归类中的作用;同时该模型采用字-词语-句层次的注意力机制增强文本组织结构特征在话题归类中的作用。在4个标准数据集上的实验结果表明,TSOHHAN模型能够提高话题归类任务的准确率。To better utilize text logical structure features and text organizational structure features in topic classification, this paper proposes a text structure oriented hybrid hierarchical attention network for this task. The logical structure usually includes information such as title and text,and the organizational structure includes character-wordsentence layer. The model integrates text headings and text bodies to improve the role of logical structure features in topic classification,and improves the role of text organizational structure features in topic classification based on the attention mechanism of char-sentence and word-sentence levels. Experimental results on 4 datasets show that the proposed model can improve the accuracy of topic classification tasks.
关 键 词:深度学习 注意力机制 混合分层注意力网络 话题归类
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112