检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴峰[1] 李银生[1] 聂永川[1] 范通让 赵文彬 张博 WU Feng;LI Yin-sheng;NIE Yong-chuan;FAN Tong-rang;ZHAO Wen-bin;ZHANG Bo(Institute of Scientific and Technical Information of Hebei Province,Shijiazhuang Hebei 050021,China;School of Information Science and Technology,Shijiazhuang Tiedao University,Shijiazhuang Hebei 050043,China)
机构地区:[1]河北省科学技术情报研究院,河北省科技信息处理实验室,河北石家庄050021 [2]石家庄铁道大学信息科学与技术学院,河北石家庄050043
出 处:《河北省科学院学报》2018年第1期1-10,共10页Journal of The Hebei Academy of Sciences
基 金:国家自然科学基金(#61373160);河北省科技厅科技支撑计划项目(17210113D),(179676334D)
摘 要:文本标签作为一种文本关键词,能够简化科技政策中有效信息的挖掘。本文从科技政策类别角度,将标签类别分为科技投入、知识产权、农村科技和税收四类,针对传统SVM算法的缺点和标签数据不平衡的缺点,结合欧式距离思想,提出一种带有惩罚因子的ESVM科技政策文本标签分类方法。最后,对比SVM和ESVM两种分类方法,验证了本文方法在处理科技政策文本标签数据上的有效性。Text label is a kind of text keywords,can simplify extraction of effective information from science and technology policy.For science and technology policy,this paper divides text label into four kinds,such as science and technology investment,intellectual property rights,rural science and technology,tax.Aimed at the shortcoming of the traditional SVM algorithm’s label data unbalance,this paper provides a text label classification method of science and technology policy,which combines the Euclidean distance algorithm and ESVM algorithm with penalty factor.Finally,with comparing SVM and ESVM,the validity of the propose method on science and technology policy text label is verified.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.133.115.157