检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:如先姑力.阿布都热西提 贺一峰[1] 亚森.艾则孜
机构地区:[1]新疆警察学院信息安全工程系,新疆乌鲁木齐830013
出 处:《现代电子技术》2016年第10期9-13,共5页Modern Electronics Technique
基 金:国家社会科学基金科研项目(13CFX055);新疆维吾尔自治区自然科学基金科研项目(2015211A016);新疆维吾尔自治区高校科研计划科学研究重点项目(XJEDU2013I34)
摘 要:针对维吾尔文书写的数字文本的犯罪取证,提出一种基于文本分类的维吾尔文数字取证方案。首先,对维吾尔文文本进行预处理,滤除文本中非维吾尔文字符和停用词;然后,提出一种多特征空间正则化互信息(M-FNMI)算法,使用输入特征组合与类之间的互信息(MI)来代替单个特征与类之间的MI,从而提取出更准确的特征词;最后,利用支持向量机(SVM)算法来对特征进行分类。实验结果表明,该方案具有较高的分类精度,能够为犯罪取证提供判断依据。For the crime forensics of digital texts written in Uighur,a Uyghur digital forensic scheme based on text categorization is proposed. The Uyghur texts are preprocessed to filter the non Uyghur characters and stop words. A multi-feature space normalized mutual information(M-FNMI)algorithm is proposed. The mutual information(MI)between input feature combination and class is used to replace the MI between the single feature and class,so as to extract more accurate feature words. The support vector machine(SVM)algorithm is used to classify those features. Experimental results show that the proposed scheme has higher classification accuracy,and can provide a basis for criminal evidence collection.
关 键 词:数字取证 文本分类 维吾尔文 互信息 支持向量机
分 类 号:TN911-34[电子电信—通信与信息系统] TP391[电子电信—信息与通信工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.175