检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄胜[1] 郭继光[1] 陆泽健[1] 陈龙[1] 潘越[1] HUANG Sheng GUO Ji-guang LU Ze-jian CHEN Long PAN Yue(China Academy of Electronics and Information Technology, Beijing 100041, China)
出 处:《中国电子科学研究院学报》2017年第4期400-405,共6页Journal of China Academy of Electronics and Information Technology
基 金:电子信息装备体系研究国防科技重点实验室基础研究项目(DXZT-JC-ZZ-2011-015)
摘 要:针对军事领域海量Web开源情报的有效分析和利用问题,提出了一种基于主题聚类的开源情报挖掘方法。基于网络爬虫从Web上自动搜集军事开源情报数据,通过解析Web网页内容提取重要情报要素,采用层次聚类算法自动生成情报主题。最后,通过实际Web数据对军事开源情报主题生成效果进行评估。实验结果表明该方法在情报主题聚类熵值、纯度和算法运行时间上均具有良好的表现。Aiming at the demand of effective analysis and utilization of the massive military open source intelligence on the Web,this paper proposes a topic clustering based method for automatic open source intelligence mining. The method utilizes web crawler to collect relevant military open source intelligence data from multiple Web sources,and extracts the important intelligence elements by parsing Web pages,then employs the Chameleon hierarchical clustering algorithm to generate intelligence topic automatically.At last,experimental evaluation of the effectivity and efficiency of this method using the real Web data was conducted. The experiment results demonstrated that this method has improved the entropy,purity and algorithm runtime of military open source intelligence topic generation effectively.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222