检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨锐[1,2] 陈伟 何涛[4] 张敏 李蕊伶 岳芳[1,2] Yang Rui;Chen Wei;He Tao;Zhang Min;Li Ruiling;Yue Fang(Wuhan Library,Chinese Academy of Sciences,Wuhan 430074,China;Key Laboratory of Science and Technology of Hubei Province,Wuhan 430074,China;School of Economics and Management,University of Chinese Academy of Sciences,Beijing 100190,China;Department of Information Security,Naval University of Engineering,Wuhan 430033,China)
机构地区:[1]中国科学院武汉文献情报中心,湖北武汉430074 [2]科技大数据湖北省重点实验室,湖北武汉430074 [3]中国科学院大学经济与管理学院,北京100190 [4]海军工程大学信息安全系,湖北武汉430033
出 处:《现代情报》2020年第4期42-49,共8页Journal of Modern Information
基 金:中国科学院文献情报能力建设专项“文献情报’数据湖’及开放式大数据框架建设”(项目编号:院1852);中国科学院战略研究和决策支持系统建设专项(项目编号:GHJ-ZLZX-2019-35);中国科学院青年创新促进会项目(项目编号:2017221);中国科学院变革性洁净能源关键技术与示范战略性先导科技专项战略研究课题(项目编号:XDA21010100);中国科学院文献情报能力建设专项经费(项目编号:Y9290001)
摘 要:[目的/意义]针对能源政策语义信息丰富的特点,研究不同环境下卷积神经网络模型对能源政策文本特征分类识别的效果并提出优化方法,辅助能源政策信息资源进行自动分类操作,方便研究人员更好地进行能源政策解读。[方法/过程]在不同环境下利用字符级和词级卷积神经网络模型对能源政策自动文本分类识别效果进行实验,从标题、内容、核心主题句等角度全面对比分析,利用Doc2Vec抽取不同比例核心主题句,将这些主题信息融入卷积神经网络模型中以对实验进行优化。[结果/结论]随着核心主题句抽取率的提高F1均值呈正态分布,当抽取率为70%时达到平衡,神经网络模型评估F1均值为83.45%,较实验中的其它方法均有所提高,通过Doc2Vec提取主题信息,并将其融入卷积神经网络的方法有效提升了卷积神经网络模型自动文本分类的效果。[Purpose/Significance]In view of the rich semantic information of energy policy,this paper studies the effect of convolutional neural network model on energy policy text feature classification and recognition under different environments,and proposes optimization methods to assist the automatic classification operation of energy policy information resources,so as to facilitate researchers to better interpret energy policy.[Method/Process]This paper used character-level and word-level convolution neural network model to test the effect of automatic classification and recognition of energy policy texts in different environments.It made a comprehensive comparative analysis from the perspective of title,content and core topic sentences,and extracted different proportion of core topic sentences by Doc2Vec for optimization experiments.[Result/Conclusion]With the increase of the extraction rate of core topic sentences,the average value of F1 was normal distribution.When the extraction rate is 70%,the balance was reached.The average value of F1 evaluated by the neural network model was 83.45%.Compared with other methods in the experiment,the using of topic information which was extracted with Doc2Vec effectively improved the automatic classification effect of the convolutional neural network model.
关 键 词:能源政策 卷积神经网络 文本分类 词向量 文本向量
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7