云南高校图书馆联盟文献共享服务平台- 文本分类

文本分类: 作品数：4114被引量：14019H指数：45; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：刘海峰王明文朱颢东鲁明羽刘守生更多>>; 相关机构：北京邮电大学深圳市腾讯计算机系统有限公司平安科技(深圳)有限公司中国科学院更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>

利用自然语言处理技术提升医院档案信息提取的效率: 《计算机应用文摘》2025年第9期94-96,共3页傅天一; 传统的档案信息提取方法主要依赖人工操作,这不仅耗时费力,还易出现错误,影响数据的准确性和可靠性。随着自然语言处理(Natural Language Processing,NLP)技术的迅速发展,医院档案信息提取的效率得到了显著提升。文章探讨了如何应用NLP...; 关键词：自然语言处理档案信息提取文本分类命名实体识别关系抽取医疗信息处理

硬件有限环境中低资源文本分类新策略: 《现代电子技术》2025年第8期56-62,共7页尹照煜宋文爱刘宏昊; 山西省研究生实践创新项目(2023SJ223)。; 针对在硬件资源有限的情况下,难以有效提升低资源分类任务性能这一难题,提出使用基于新一代大型语言模型Claude3 Haiku的数据增强,并设计了一种更小更快的文本分类模型EQSBERT。首先基于Claude3 Haiku,使用分布式比例增强法和动态均衡...; 关键词：自然语言处理低资源文本分类大型语言模型Claude3 Haiku 数据增强 GPT-4 多目标知识蒸馏

基于特征融合结合注意力机制的藏文文本分类模型: 《科技创新与应用》2025年第10期61-65,共5页冯宇舒艾金勇李爽; 由于藏语与汉语、英语在语法结构和词汇特点上的差异,传统的文本分类方法在藏文上的应用面临挑战。为此,该文提出一种基于多特征融合与注意力机制的藏文文本分类模型,该模型结合CINO、TextCNN和BiLSTM模型的优势。实验结果表明,该文提...; 关键词：藏文文本分类预训练语言模型多特征融合注意力机制文本分类方法

基于Mega模型的文本分类与长文本生成研究: 《信息技术与信息化》2025年第4期127-130,共4页许惠惠; 教育部职业院校信息化教学指导委员会2024年度全国高等职业院校信息技术课程教学改革研究项目课题“医药类高职院校‘信息技术’课程数字化项目实践教学建设研究”的阶段性成果(KT2024176);2021年度山西省高等学校哲学社会科学研究项目(思想政治教育专项)“新时代高职大学生群体画像构建研究”的阶段性成果(2021zsszsx207);2021年度山西省教育科学规划课题“基于神经网络模型的校企协同顶岗实习的评价研究”的阶段性成果(PJ-21045)。; 随着社交媒体、新闻平台和电商评论等领域中长文本数据的激增,传统模型如RNN和LSTM在建模长距离依赖方面存在局限,而Transformer在处理超长文本时计算开销巨大。为此,文章提出基于Mega(moving average equipped gated attention)模型的...; 关键词：Mega模型文本分类长文本生成门控注意力机制指数移动平均

基于预训练表示和宽度学习的虚假新闻早期检测: 《郑州大学学报（理学版）》2025年第2期31-36,共6页胡舜邦王琳刘伍颖; 教育部人文社会科学研究规划基金项目(20YJAZH069);教育部人文社会科学研究青年基金项目(20YJC740062);山东省研究生教育教学改革研究项目(SDYJG21185);山东省本科教学改革研究重点项目(Z2021323);上海市哲学社会科学“十三五”规划课题(2019BYY028)。; 为了实现虚假新闻的早期检测,提出一种基于预训练表示和宽度学习的虚假新闻早期检测方法。首先,将新闻文本输入大规模预训练语言模型RoBERTa中,得到对应新闻文本的上下文语义表示。其次,将得到的新闻文本的上下文语义表示输入宽度学习...; 关键词：早期检测虚假新闻预训练表示宽度学习文本分类

基于类内空间夹角约束和小样本采样的错误标签数据识别方法: 《电力自动化设备》2025年第4期169-176,185,共9页张亦翔虞佳淼王慧芳费正明罗华峰宣佳卓; 国家电网有限公司华东分部科技项目(520800230008)。; 在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束...; 关键词：电力领域文本分类错误标签数据识别类内空间夹角加性角度边距惩罚小样本采样

基于词嵌入约束和图卷积神经网络的法律案情分类模型构建研究: 《江苏科技大学学报(自然科学版)》2025年第2期84-91,共8页孟春运谈镇栾力 ABEO Timothy Apasiba; 国家社会科学基金重点项目(16AJL008)。; 图卷积神经网络善于理解文本整体结构和语义信息,可捕获文本数据中的全局关联性,但训练数据的质量会影响其分类性能.因此,提出了基于词嵌入约束和图卷积神经网络的法律案情分类模型,该模型以法律案情数据为基础,构建全局词语共现信息的...; 关键词：深度学习数据挖掘文本分类司法效率图卷积神经网络

基于融合词向量模型的特色文献分类: 《现代信息科技》2025年第8期157-160,164,共5页陈蓝周杰杨帆; 贵州财经大学2022年度校级科研基金项目(2022KYYB14);2024年度贵州省高校人文社会科学研究项目(2024RW313)。; 图书馆服务工作中,面对小数据量的地方特色文献,管理人员需要花费大量时间精力手动整理地方特色文献。为实现特色文献实现自动化预分类,文章提出了针对小数据量的文献自动化分类模型CSGB,以贵州省特色文献数据集为实验对象,通过GloVe及B...; 关键词：地方特色文献文本分类文本向量化

融合ERNIE与知识增强的临床短文本分类研究: 《计算机工程与应用》2025年第8期108-116,共9页温浩杨洋; 教育部人文社科规划项目(23YJAZH147);国家自然科学基金(71673213)。; 提出一种引入专业医疗知识与文本独特知识的ERNIE模型用于识别无规则的临床短文本。目前ERNIE模型具有一定的医疗领域知识,但是在处理下游任务时无法引入专业医疗知识与文本独特知识,因此为提高临床短文本分类的精确度与效率,提出KW-ERN...; 关键词：深度学习知识图谱 ERNIE 语义强化临床短文本分类

融合预训练和双级元蒸馏的医学短文本分类方法: 《计算机工程与应用》2025年第8期117-125,共9页廖列法姜炫至; 为解决医学文本使用预训练模型处理速度慢、对硬件的算力要求高、难以分辨少样本类别,以及使用传统小模型由于自身限制难以做到足够的准确度的问题,提出了一种融合预训练和元蒸馏的文本分类模型PTMD(fusion of pre-training and meta di...; 关键词：文本分类预训练模型知识蒸馏

文本分类