检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]铁道警察学院公安技术系,河南郑州450053
出 处:《现代电子技术》2015年第24期44-46,49,共4页Modern Electronics Technique
基 金:2015年河南省高等学校重点科研项目:基于数据挖掘的反恐情报分析技术研究(15B520027);2015年河南省高等学校重点科研项目:基于大数据的公安信息化应用技术研究(15A120014)
摘 要:网络敏感信息挖掘过程中,敏感信息和正常信息的特征不同,具有较高的遮蔽性。利用传统敏感信息挖掘方法时,固有的敏感信息被遮蔽,无法进行敏感信息的准确挖掘。提出基于TF-IDF改进聚类算法的网络敏感信息挖掘方法,通过TF-IDF方法获取网络敏感信息文本,在网络敏感信息文本中获取有价值的敏感信息特征,采用该信息完成聚类算法,对全部敏感信息特征进行聚类分析,完成网络敏感信息的挖掘。实验结果说明,所提方法进行网络敏感信息挖掘,具有较高的挖掘效率和精度。In the mining process of objectionable Internet information,the sensitive information is different from normal information and has high shadowing property. When the traditional method is taken to excavate the sensitive information,the sensitive information can not be mined accurately because the inherent sensitive information is obscured. The objectionable Internet information excavation algorithm is proposed,in which clustering algorithm is improved on the basis of TF-IDF. It uses TF-IDF algorithm to obtain objectionable Internet informative text,in which valuable features of the sensitive information are got. This information is used to complete the clustering algorithm,and all the sensitive information features are clustered and analyzed,so that the network sensitive information is mined completely. The experimental results show that the proposed method has high efficiency and precision for objectionable network information excavation.
分 类 号:TN911-34[电子电信—通信与信息系统] TP33[电子电信—信息与通信工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.94