基于文本分类的维吾尔文数字取证研究被引量：1

Research on Uyghur digital forensics based on text categorization

出　　处：《现代电子技术》2016年第10期9-13,共5页Modern Electronics Technique

基　　金：国家社会科学基金科研项目(13CFX055);新疆维吾尔自治区自然科学基金科研项目(2015211A016);新疆维吾尔自治区高校科研计划科学研究重点项目(XJEDU2013I34)

摘　　要：针对维吾尔文书写的数字文本的犯罪取证,提出一种基于文本分类的维吾尔文数字取证方案。首先,对维吾尔文文本进行预处理,滤除文本中非维吾尔文字符和停用词;然后,提出一种多特征空间正则化互信息(M-FNMI)算法,使用输入特征组合与类之间的互信息(MI)来代替单个特征与类之间的MI,从而提取出更准确的特征词;最后,利用支持向量机(SVM)算法来对特征进行分类。实验结果表明,该方案具有较高的分类精度,能够为犯罪取证提供判断依据。For the crime forensics of digital texts written in Uighur,a Uyghur digital forensic scheme based on text categorization is proposed. The Uyghur texts are preprocessed to filter the non Uyghur characters and stop words. A multi-feature space normalized mutual information（M-FNMI）algorithm is proposed. The mutual information（MI）between input feature combination and class is used to replace the MI between the single feature and class,so as to extract more accurate feature words. The support vector machine（SVM）algorithm is used to classify those features. Experimental results show that the proposed scheme has higher classification accuracy,and can provide a basis for criminal evidence collection.

关键词：数字取证文本分类维吾尔文互信息支持向量机

分类号：TN911-34[电子电信—通信与信息系统] TP391[电子电信—信息与通信工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于文本分类的维吾尔文数字取证研究被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于文本分类的维吾尔文数字取证研究 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于文本分类的维吾尔文数字取证研究被引量：1