中文文本分类

作品数:160被引量:1384H指数:17
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:袁方陈军华张翔周明全王俊英更多>>
相关机构:河北大学西安电子科技大学清华大学西北大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划河北省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
结合标签混淆的中文文本分类数据增强技术
《计算机应用》2025年第4期1113-1119,共7页孙海涛 林佳瑜 梁祖红 郭洁 
教育部产学合作协同育人项目(220901229305933)。
传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标...
关键词:数据增强 文本分类 标签混淆 中文新闻主题 预训练模型 
融合知识图谱与多神经网络的文本分类模型
《武汉大学学报(工学版)》2024年第12期1803-1812,共10页黎超 廖薇 
国家自然科学基金项目(编号:62001282)。
针对现有文本分类方法无法充分提取中文文本中的语义特征,从而影响分类效果的问题,提出一种融合知识图谱与多神经网络的文本分类模型KGMNN(knowledge graph and multiple neural network)。首先,该模型以Word2Vec作为嵌入层对文本进行...
关键词:神经网络 注意力机制 知识图谱 中文文本分类 
基于深度学习的中文文本分类综述被引量:2
《计算机工程与科学》2024年第4期684-692,共9页高珊 李世杰 蔡志平 
大数据时代,随着社交媒体的不断普及,在网络以及生活中,各类文本数据日益增长,采用文本分类技术对文本数据进行分析和管理具有重要的意义。文本分类是自然语言处理领域中的一个基础研究内容,在给定标准下,根据内容对文本进行分类,文本...
关键词:中文文本分类 自然语言 深度学习 机器学习 
基于提示学习的中文文本分类方法探究
《火力与指挥控制》2023年第10期198-203,211,共7页蔡飞 宋城宇 王思远 李佩宏 林可菁 
自动文本分类方法是当前信息化和数据化时代处理非结构化信息的基本方法,是提升决策系统智能化程度的关键技术手段。近年来,由于其在小样本领域以及迁移学习方面的优异性能,基于提示学习的文本分类方法逐渐被广泛应用于一系列自然语言...
关键词:提示学习 文本分类 预训练语言模型 
面向中文文本分类的对抗样本生成方法被引量:1
《电子器件》2023年第5期1349-1356,共8页弓燕 张晓琳 刘月峰 刘立新 徐立 
国家自然科学基金项目(61562065);内蒙古自治区自然科学基金项目(2019MS06001,2019MS06036)。
针对深度神经网络鲁棒性问题,提出了一种面向中文文本分类的黑盒对抗样本生成方法WordBeguiler。该方法结合汉字的字形、字音特征构建对抗搜索空间,设计了新的扰动定位方式寻找影响分类结果的重要字或词组,并根据概率权重选取的方法确...
关键词:中文文本分类 对抗样本 深度神经网络 汉字特征 黑盒 
基于卷积神经网络的中文文本分类研究
《信息与电脑》2023年第20期94-96,共3页谢莉萍 
宁夏大学新华学院+2019年宁夏回族自治区本科一流专业—计算机科学与技术专业建设项目。
提出基于卷积神经网络(Convolutional Neural Networks,CNN)的中文文本分类方法。首先,利用Python网络爬虫爬取某新闻网站的短讯作为原始数据,进行分词和停词处理。其次,使用Skip-gram模型将文本表示为特征向量,送入神经网络经过卷积操...
关键词:卷积神经网络(CNN) 中文文本分类 算法 
采用CNN进行中文文本分类被引量:2
《现代计算机》2023年第16期69-71,80,共4页火善栋 
通过卷积神经网络,运用两种不同的方案对中文文本分类进行了对比实验,实验结果表明,对于中文文本分类问题,仅采用CNN中的全连接层并选择合适的特征词和激活函数就可以达到比较理想的分类效果。
关键词:卷积神经网络 中文文本分类 特征词 激活函数 
面向中文文本分类的字符级对抗样本生成方法被引量:3
《电子与信息学报》2023年第6期2226-2235,共10页张顺香 吴厚月 朱广丽 许鑫 苏明星 
国家自然科学基金(62076006);安徽高校协同创新项目(GXXT-2021-008);安徽省研究生科研项目(YJS20210402)。
对抗样本生成是一种通过添加较小扰动信息,使得神经网络产生误判的技术,可用于检测文本分类模型的鲁棒性。目前,中文领域对抗样本生成方法主要有繁体字和同音字替换等,这些方法都存在对抗样本扰动幅度大,生成对抗样本质量不高的问题。...
关键词:对抗样本生成 文本分类 情感分类 多音字 字符级对抗样本 
基于预训练模型融合深层特征词向量的中文文本分类被引量:4
《上海理工大学学报》2023年第2期189-197,204,共10页汤英杰 刘媛华 
国家自然科学基金资助项目(71771152)。
为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语...
关键词:预训练模型 Roberta模型 DPCNN模型 特征词向量 中文文本分类 
CCM-MF:基于多维度特征融合的中文文本分类模型被引量:1
《广西科学》2023年第1期35-42,共8页马子晨 张顺香 刘云朵 王星光 张友强 
国家自然科学基金面上项目(62076006);安徽省高校协同创新项目(GXXT 2021008)资助。
针对中文文本中不同维度特征所携带的语义信息具有差异性的问题,本文提出一种基于多维度特征融合的中文文本分类模型:CCM-MF(Chinese-text Classification Model Based on FusedMulti-dimensional Features)。该模型融合层次维度和空间...
关键词:中文文本分类 多维度 ERNIE DPCNN Att-BLSTM 
检索报告 对象比较 聚类工具 使用帮助 返回顶部