基于文本分类的维吾尔文数字取证研究  被引量:1

Research on Uyghur digital forensics based on text categorization

在线阅读下载全文

作  者:如先姑力.阿布都热西提 贺一峰[1] 亚森.艾则孜 

机构地区:[1]新疆警察学院信息安全工程系,新疆乌鲁木齐830013

出  处:《现代电子技术》2016年第10期9-13,共5页Modern Electronics Technique

基  金:国家社会科学基金科研项目(13CFX055);新疆维吾尔自治区自然科学基金科研项目(2015211A016);新疆维吾尔自治区高校科研计划科学研究重点项目(XJEDU2013I34)

摘  要:针对维吾尔文书写的数字文本的犯罪取证,提出一种基于文本分类的维吾尔文数字取证方案。首先,对维吾尔文文本进行预处理,滤除文本中非维吾尔文字符和停用词;然后,提出一种多特征空间正则化互信息(M-FNMI)算法,使用输入特征组合与类之间的互信息(MI)来代替单个特征与类之间的MI,从而提取出更准确的特征词;最后,利用支持向量机(SVM)算法来对特征进行分类。实验结果表明,该方案具有较高的分类精度,能够为犯罪取证提供判断依据。For the crime forensics of digital texts written in Uighur,a Uyghur digital forensic scheme based on text categorization is proposed. The Uyghur texts are preprocessed to filter the non Uyghur characters and stop words. A multi-feature space normalized mutual information(M-FNMI)algorithm is proposed. The mutual information(MI)between input feature combination and class is used to replace the MI between the single feature and class,so as to extract more accurate feature words. The support vector machine(SVM)algorithm is used to classify those features. Experimental results show that the proposed scheme has higher classification accuracy,and can provide a basis for criminal evidence collection.

关 键 词:数字取证 文本分类 维吾尔文 互信息 支持向量机 

分 类 号:TN911-34[电子电信—通信与信息系统] TP391[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象