文档分类

作品数:119被引量:406H指数:10
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周水庚胡运发钱旭王自强刘超更多>>
相关机构:北京百度网讯科技有限公司南京大学复旦大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划教育部科学技术研究重点项目国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于双流自适应特征融合的多模态烟草文档分类
《绿洲农业科学与工程》2025年第1期160-163,共4页孙首名 张琦 王喆 苏娜 沈奇 
国家自然科学基金面上项目一多时延全基因组调控网络的大规模动态概率图建模与分析(62072089)。
针对烟草文档自动化分类的需求,提出一种基于双流自适应特征融合的多模态烟草文档分类网络,名为DSAFFNet。该网络结合烟草文档的文本模态和图像模态,采用DSAFF(Dual-StreamAdaptiveFeatureFusion)模块对不同模态特征的重要性自适应调整...
关键词:烟草文档分类 多模态学习 双流网络 
一种基于DA_FASTTEXT的文档分类研究
《价值工程》2025年第6期145-147,共3页王栋平 穆宁 王峥 张晓燕 
国家重点研发计划(2023YFB3106900);江苏省科技厅产业前瞻与关键核心技术重点项目(BE2023004)。
传统文档分类系统都是基于文档的词属性,利用庞大的词典支持和复杂的切词处理实现文档分类,导致很难兼顾分类准确性和分类速度。本文研究基于FASTTEXT算法的中文文档分类,使中文文档分类在保证分类准确性的同时还降低了时间开销,同时利...
关键词:文档分类 蜻蜓优化算法(DA) 参数优化 FASTTEXT算法 
基于深度学习的工程文件识别与分类
《微型电脑应用》2025年第1期120-122,129,共4页白创 蒋俊权 
设计了一种基于深度学习的工程文件识别与分类方法。对文档图像进行预处理操作,利用Faster-区域卷积神经网络(RCNN)模型检测出预处理后图像的表头部分;对完成检测的图像进行字符识别,得到表头文字信息;使用基于Transformers的双向编码...
关键词:深度学习 文档分类 字符识别 神经网络 
一种基于词加权LDA模型的恶意文件检测方法被引量:1
《计算机应用与软件》2024年第3期313-320,共8页徐建国 王旭阳 
2016年青岛市哲学社会科学规划项目(QDSKL1601121);2017年山东省高校人文社会科学研究计划(思想政治教育专题研究)资助经费项目(J17ZZ27);2018年山东科技大学研究生科技创新项目(SDKDYC180339)。
恶意文件中往往含有出现频率较低、但表征能力更好的特征码,传统的方法未能将这一类特征提取出来。针对该问题,提出一种基于词加权LDA模型的恶意文件检测方法,该方法通过反汇编对样本进行预处理,采用改进的KeyGraph算法(IKG)提取“重点...
关键词:恶意文件 LDA IKG 加权模型 文档分类 
基于改进自注意力机制和表示学习的分层文档分类方法
《计算机科学》2024年第2期238-244,共7页廖兴滨 钱杨舸 王乾垒 秦小林 
四川省科技计划(2019ZDZX0006,2020YFQ0056);中科院STS计划区域重点A类(KFJ-STS-QYZD-2021-21-001)。
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型...
关键词:句子表示 文档表示 注意力机制 文档分类 模型可解释性 
基于异质图神经网络预训练的多标签文档分类研究
《计算机科学》2024年第1期143-149,共7页吴家伟 方全 胡骏 钱胜胜 
国家自然科学基金(62072456,62036012,62106262)。
多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考...
关键词:多标签文档分类 元数据 异质图神经网络 预训练 长尾分布 
面向恶意PDF文档分类的对抗样本生成方法研究被引量:1
《信息安全学报》2023年第5期14-26,共13页刘超 娄尘哲 喻民 姜建国 黄伟庆 
中国科学院青年创新促进会(No.2021155)资助。
通过恶意文档来传播恶意软件在现代互联网中是非常普遍的,这也是众多机构面临的最高风险之一。PDF文档是全世界应用最广泛的文档类型,因此由其引发的攻击数不胜数。使用机器学习方法对恶意文档进行检测是流行且有效的途径,在面对攻击者...
关键词:恶意PDF文档 对抗样本 文档分类 样本生成 鲁棒性 
基于书目题名数据的超短文本分类研究
《内蒙古科技与经济》2022年第10期144-147,共4页苏东出 孙萍 
以书目题名数据为例,探究了一种基于线性空间基的超短文本特征向量生成方式,并在此基础上,利用改进的卷积神经网络进行深度学习,对超短文本进行多元分类的思路。经过测试,该算法针对22分类的准确率可达67%以上,部分专业分类准确率达到85...
关键词:深度学习 卷积神经网络 超短文本 文档分类 
一种注意力序列到序列模型的生成式层次文档分类被引量:3
《图书馆学研究》2022年第5期45-56,共12页戎璐 张亚洲 
国家自然科学基金青年基金项目“面向互动对话的类量子情感分析模型”(项目编号:62006212)的研究成果之一。
准确建模文档类别层次结构,自动分类文档,能够推进文档数字化、智能化等领域发展。针对当前方法忽略“父子”类目关联的问题,将层次文档分类视作序列生成任务,构建段间、段内注意力机制及编码器与解码器结构将输入文档序列转换为多层类...
关键词:文档分类 层次分类 深度学习 文献管理 
基于局部注意力机制的弱监督长文档分类被引量:1
《计算机系统应用》2021年第11期54-62,共9页马雯琦 何跃 
国家自然科学基金(71571174)。
自然语言处理中的文档分类任务需要模型从低层级词向量中抽取高层级特征.通常,深度神经网络的特征抽取会利用文档中所有词语,这种做法不能很好适应内容较长的文档.此外,训练深度神经网络需要大量标记数据,在弱监督情况下往往不能取得良...
关键词:文档分类 深度学习 弱监督学习 伪文档 局部注意力机制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部