检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机与现代化》2017年第4期78-81,共4页Computer and Modernization
基 金:河南省科技攻关项目(132102310284);河南省教育厅科学技术研究重点项目(14A520015)
摘 要:互联网短文本的分类是自然语言处理的一个研究热点。本文提出一种基于卷积神经网络(Convolutional Neural Networks,CNNs)互联网短文本分类方法。首先通过Word2vec的Skip-gram模型获得短文特征,接着送入CNNs中进一步提取高层次特征,最后通过K-max池化操作后放入Softmax分类器得出分类模型。在实验中,该方法和机器学习方法以及DBN方法相比,结果表明本文方法不仅解决了文本向量的维数灾难和局部最优解问题,而且有效地提高了互联网短文本两级分类准确率,证实了基于CNNs的互联网短文本分类的有效性。The Internet short-text classification is a hot research topic in natural language processing. This paper presents a short text classification method based on deep learning's convolutional neural networks. First short-text features are achieved by the Skip-gram model of Word2vec,then it is sent into the CNNs to extract high-level features,after the K-max pooling,it is put into the Softmax classifier to get a classification model. In the Internet short-text classification experiments,compared to machine learning and DBN's method,the results show that the proposed method not only solves the problems of the curse of dimensionality of text vector and the local optimal solution,but also effectively improves the accuracy of Internet short-text classification,and confirms the validity of the Internet short-text classification method based on CNNs.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28