中文文本

作品数:737被引量:4133H指数:27
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘怀亮张雪英张顺香张仰森张春菊更多>>
相关机构:北京邮电大学华南理工大学清华大学西安电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 主题=文本分类x
条 记 录,以下是1-10
视图:
排序:
结合标签混淆的中文文本分类数据增强技术
《计算机应用》2025年第4期1113-1119,共7页孙海涛 林佳瑜 梁祖红 郭洁 
教育部产学合作协同育人项目(220901229305933)。
传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标...
关键词:数据增强 文本分类 标签混淆 中文新闻主题 预训练模型 
简单且有效的弱监督中文文本分类算法
《计算机工程与应用》2025年第4期192-210,共19页陈中涛 周亚同 
目前基于种子词的弱监督文本分类算法大多需要从数据集中搜索所有种子词并以此扩展类别词典,出现频率较低的种子词的类别识别能力也较低。因此设计了一个简单且有效的弱监督中文文本分类算法(simple and effective weakly supervised Ch...
关键词:弱监督 文本分类 自训练 种子词 
融合知识图谱与多神经网络的文本分类模型
《武汉大学学报(工学版)》2024年第12期1803-1812,共10页黎超 廖薇 
国家自然科学基金项目(编号:62001282)。
针对现有文本分类方法无法充分提取中文文本中的语义特征,从而影响分类效果的问题,提出一种融合知识图谱与多神经网络的文本分类模型KGMNN(knowledge graph and multiple neural network)。首先,该模型以Word2Vec作为嵌入层对文本进行...
关键词:神经网络 注意力机制 知识图谱 中文文本分类 
基于增强语言表示模型的网络新闻长文本分类的研究
《江汉大学学报(自然科学版)》2024年第4期37-44,共8页许楠桸 柯圆圆 胡晓莉 
江汉大学研究生科研创新基金项目(KYCXJJ202350)。
基于网络实时新闻内容数据,对一份具有时效的中文长文本数据集进行了新闻主题分类。利用年度关键词增强的分词方案提升分词精度,采用一种长文本压缩方法处理中文长文本的特殊数据,具体方法为选择关键句并利用TF-IDF算法提取长文本中关键...
关键词:ERNIE模型 预训练模型 新闻分类 长文本处理 中文文本 
传统与大模型并举:中文文本分类技术对比研究
《智能计算机与应用》2024年第6期88-94,共7页文飞 
本文专注于探索与实践中文文本分类技术的演进,通过严谨的实证对比研究,检验了传统技术方法与基于大模型的先进算法在各类文本分类任务中的表现差异。研究在涵盖情感分析的基础数据集和富含复杂专业信息的多类别文本数据集上展开了深入...
关键词:文本分类 BERT 预训练大语言模型 提示工程 微调 小样本学习 
基于深度学习的中文文本分类综述被引量:2
《计算机工程与科学》2024年第4期684-692,共9页高珊 李世杰 蔡志平 
大数据时代,随着社交媒体的不断普及,在网络以及生活中,各类文本数据日益增长,采用文本分类技术对文本数据进行分析和管理具有重要的意义。文本分类是自然语言处理领域中的一个基础研究内容,在给定标准下,根据内容对文本进行分类,文本...
关键词:中文文本分类 自然语言 深度学习 机器学习 
基于在线翻译的中文文本数据增强技术
《计算机与数字工程》2024年第3期791-794,共4页王小天 奚彩萍 
数据增强是少样本学习领域中的一种常见方法,对于文本数据,一种通用的增强方式是反译,通过神经翻译机,将数据翻译为某种中间语言,再翻译为原语言。但受限于公开平行语料库的数量与质量,个人研究者很难训练出符合要求的神经翻译机。为了...
关键词:数据增强 自然语言处理 反译 文本分类 
基于提示学习的中文文本分类方法探究
《火力与指挥控制》2023年第10期198-203,211,共7页蔡飞 宋城宇 王思远 李佩宏 林可菁 
自动文本分类方法是当前信息化和数据化时代处理非结构化信息的基本方法,是提升决策系统智能化程度的关键技术手段。近年来,由于其在小样本领域以及迁移学习方面的优异性能,基于提示学习的文本分类方法逐渐被广泛应用于一系列自然语言...
关键词:提示学习 文本分类 预训练语言模型 
面向中文文本分类的对抗样本生成方法被引量:1
《电子器件》2023年第5期1349-1356,共8页弓燕 张晓琳 刘月峰 刘立新 徐立 
国家自然科学基金项目(61562065);内蒙古自治区自然科学基金项目(2019MS06001,2019MS06036)。
针对深度神经网络鲁棒性问题,提出了一种面向中文文本分类的黑盒对抗样本生成方法WordBeguiler。该方法结合汉字的字形、字音特征构建对抗搜索空间,设计了新的扰动定位方式寻找影响分类结果的重要字或词组,并根据概率权重选取的方法确...
关键词:中文文本分类 对抗样本 深度神经网络 汉字特征 黑盒 
基于卷积神经网络的中文文本分类研究
《信息与电脑》2023年第20期94-96,共3页谢莉萍 
宁夏大学新华学院+2019年宁夏回族自治区本科一流专业—计算机科学与技术专业建设项目。
提出基于卷积神经网络(Convolutional Neural Networks,CNN)的中文文本分类方法。首先,利用Python网络爬虫爬取某新闻网站的短讯作为原始数据,进行分词和停词处理。其次,使用Skip-gram模型将文本表示为特征向量,送入神经网络经过卷积操...
关键词:卷积神经网络(CNN) 中文文本分类 算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部