检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张晓丹[1] Zhang Xiaodan(Institute of Scientific and Technical Information of China,Beijing 100038)
出 处:《情报杂志》2021年第1期184-188,共5页Journal of Intelligence
基 金:中国科学技术信息研究所创新面上项目“基于多级降维CNN深度学习策略的NSTL期刊论文大数据分类应用研究”(编号:MS2020-07)研究成果之一。
摘 要:[目的/意义]随着互联网数字资源的剧增,如何从海量数据中挖掘出有价值的信息成为数据挖掘领域研究的热点问题。文本大数据分类是这一领域的关键问题之一。随着深度学习的发展,使得基于深度学习的文本大数据分类成为可能。[方法/过程]针对近年来出现的图神经网络文本分类效率低的问题,提出改进的方法。利用文本、句子及关键词构建拓扑关系图和拓扑关系矩阵,利用马尔科夫链采样算法对每一层的节点进行采样,再利用多级降维方法实现特征降维,最后采用归纳式推理的方式实现文本分类。[结果/结论]为了测试该文所提方法的性能,利用常用的公用语料库和自行构建的NSTL科技期刊文献语料库对本文提出的方法进行实验,与当前常用的文本分类模型进行准确率和推理时间的比较。实验结果表明,所提出的方法可在保证文本及文献大数据分类准确率的前提下,有效提高分类的效率。[Purpose/Significance]With the explosion of electronic data,big data mining has become a hot research issue in the field of data mining,and the classification of text big data based on deep learning is one of the key issues in this field.[Method/Process]In view of the low efficiency of text classification based on graph convolutional neural network in recent years,an improved method is proposed.This method uses text,sentences and keywords to construct topology diagram and relationship matrix,uses Markov chain sampling algorithm to sample nodes of each layer,and then uses multistage dimension reduction method to realize feature dimensionality reduction,and finally realizes text classification by inductive reasoning.[Result/Conclusion]The paper's methods,FSATGCN,GCN and other classification methods were tested by using the corpus constructed from NSTL journal literature.The results show that the model and method proposed in this paper can effectively improve the classification efficiency on the premise of ensuring the classification accuracy of big data in journal literature.
关 键 词:图神经网络 马尔可夫链采样算法 多级特征降维 NSTL文献分类 文本分类
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.13.165