检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:袁林[1] 葛唯益 陈晓琳 YUAN Lin;GE Weiyi;CHEN Xiaolin(The 28th Research Institute of China Electronics Technology Group Corporation, Nanjing 210007,China)
机构地区:[1]中国电子科技集团公司第二十八研究所
出 处:《指挥信息系统与技术》2019年第5期34-39,共6页Command Information System and Technology
基 金:国家重点研发计划(2018YFC0806902)资助项目
摘 要:为实现互联网上科技文字信息的有效获取和快速分析研读,研究了基于Heritrix增量式爬虫的科技情报搜集、基于科技情报语料库的统计机器翻译、面向主题-内容-结构的多特征文本自动摘要及基于支持向量机(SVM)向量空间模型的科技情报自动分类4项关键技术,设计了互联网科技情报搜集分析原型软件的技术架构和功能模块.试验表明,该原型软件能够有效提高科技情报信息的智能处理分析能力.To realize the effective acquisition and rapid analysis on the science and technology in-formation from Internet, four key technologies including the information collection based on Heritrix incremental crawler, the statistical machine translation based on the corpus of information, the automatic summary of multi-feature texts oriented to the subject, the content and the structure, and automatic classification of information based on the vector space model, support vector machine (SVM), are studied. The technical architecture and functional modules of the gathering and analysis prototype software for Internet science and technology information are designed. Experiments show that the prototype software can effectively enhance the intelligent processing and analysis capabilities of science and technology information.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15