检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周俊杰 许鸿奎[1,2] 卢江坤 张子枫 李振业 郭文涛 ZHOU Jun-jie;XU Hong-kui;LU Jiang-kun;ZHANG Zi-feng;LI Zhen-ye;GUO Wen-tao(School of Information&Electrical Engineering,Shandong Jianzhu University,Jinan 250000,China;Shandong Provincial Key Laboratory of Intelligent Building Technology,Shandong Jianzhu University,Jinan 250000,China)
机构地区:[1]山东建筑大学信息与电气工程学院,济南250000 [2]山东建筑大学山东省智能建筑技术重点实验室,济南250000
出 处:《小型微型计算机系统》2023年第11期2502-2509,共8页Journal of Chinese Computer Systems
基 金:山东省重大科技创新工程项目(2019JZZY010120)资助;山东省重点研发计划项目(2019GSF111054)资助。
摘 要:诈骗电话案件频频发生并威胁着人们的生活,含有诈骗语义的语句与内容的前后文、语句序列、局部相关内容以及显著关键词语相关.本文提出神经网络模型PEAGCNN(Position Embedding and Attention are introduced into BiGRU and CNN)对诈骗电话文本分类.首先构建相关数据集,词嵌入用于表示文本,不同频率的正弦、余弦函数对文本位置信息编码并融入词嵌入向量,然后分别利用BiGRU(Bidirectional Gated Recurrent Unit)和CNN(Convolutional Neural Network)提取文本上下文相关信息、语句序列以及局部相关性,Attention机制对提取出的信息重新分配权重,突出关键信息的作用,最后将两种信息融合,通过Softmax实现分类.在THUCNews数据集以及诈骗电话文本数据集上的实验结果表明,本文提出模型的准确率和F1值均比对比模型有提升,同时模型对诈骗电话文本数据集分类的各项性能指标均在0.91以上.Fraudulent phone cases occurred frequently and threaten people's life.Statements with fraud semantics are related to the context of the content,sentence sequences,locally relevant content,and obvious key words.In this paper,model PEAGCNN(Position Embedding and Attention are introduced into BiGRU and CNN)is proposed to classify fraudulent phone text.Firstly,dataset is constructed,and word embedding is used to represent the text.We integrate position information which are encoded by sine and cosine functions with different frequencies into the word embedding vector.Then,BiGRU and CNN are used to extract textual context-related information,sentence sequences and local correlations,respectively.And the Attention redistributes the weight of the extracted information and highlights the key information.Finally,we merge the two kinds of information to achieve classification by Softmax.The experimental results on THUCNews and the fraudulent phone text dataset show that the proposed model is better than the comparison model in Accuracy and F1.And the performance indexes for the classification of fraudulent phone text datasets are above 0.91.
关 键 词:诈骗电话文本分类 双向门控循环神经网络 卷积神经网络 位置编码 ATTENTION
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15