检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王芝辉 王晓东[1] WANG Zhihui;WANG Xiaodong(College of Computer Science and Technology,National University of Defense Technology,Changsha 410072,China)
出 处:《计算机工程》2020年第3期11-17,共7页Computer Engineering
基 金:国防科技重点实验室基金“目标指导的社交网络多模态数据分析”(6142110180405)。
摘 要:海量文本分析是实现大数据理解和价值发现的重要手段,其中文本分类作为自然语言处理的经典问题受到研究者广泛关注,而人工神经网络在文本分析方面的优异表现使其成为目前的主要研究方向。在此背景下,介绍卷积神经网络、时间递归神经网络、结构递归神经网络和预训练模型等主流方法在文本分类中应用的发展历程,比较不同模型基于常用数据集的分类效果,表明利用人工神经网络结构自动获取文本特征,可避免繁杂的人工特征工程,使文本分类效果得到提升。在此基础上,对未来文本分类的研究方向进行展望。Large-scale text analysis is an important means of understanding and finding value of big data.Hence text classification,as a classical natural language processing problem,has been widely concerned by researchers,and its main research direction is artificial neural network due to its excellent performance in text analysis.This paper introduces the history of Convolutional Neural Network(CNN),Recurrent Neural Network(RNN),recursive neural network structure and the pretraining model applied to text classification.Then this paper compares classification performance of different models based on the common dataset,demonstrating that artificial neural network structure can reduce manual characterization work by automatically obtaining text features,and thus improve text classification effects.On this basis,this paper prospects the future research directions of text classification.
关 键 词:大数据 自然语言处理 文本分类 神经网络 文本分析
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.113.167