检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安阳师范学院计算机与信息工程学院,河南安阳455000 [2]安阳师范学院软件学院,河南安阳455000
出 处:《计算机仿真》2017年第7期256-259,共4页Computer Simulation
基 金:国家自然科学基金资助项目(41001251);河南省教育厅科学技术研究重点项目(13A520011);河南省科技计划项目(132102210212);河南省高校科技创新团队支持计划资助(17IRTSTHN012);河南省高等学校重点科研项目(16B520003)
摘 要:对互联网数据资源中特征用户准确识别,可提高互联网特征用户的安全性。进行特征用户识别时,应准确提取特征用户的有效特征,建立带识别样本中条件熵最大的模型,并通过相关条件对模型进行约束优化完成识别,但是传统方法是通过利用朴素贝叶斯模型进行用户特征识别,但是不能对特征用户的有效特征进行准确提取,也无法通过相关条件进行约束优化,降低了特征用户识别的有效性,提出一种基于最大熵的互联网数据资源中特征用户准确识别方法,分析互联网数据资源中特征用户名用字的特点,提取有效特征,利用最大熵原理构建模型对互联网数据资源中特征用户进行准确识别。并在一个40万余的中文人名语料上进行训练和测试,对比了依据不同特征组合进行用户识别的准确率,仿真结果表明,与传统的基于贝叶斯分类器方法相比,利用提出的方法进行互联网数据资源中特征用户识别时的准确率较高。In this paper, we propose an accurate recognition method of feature users in internet data resources based on the maximum entropy. Firstly, the research analyzed diction characteristics of feature user name and extrac- ted effective features, then built a model to recognize feature user accurately using maximum entropy theory. Finally, we carried out training and tests for corpus with four hundred thousand Chinese names and compared the accuracy rates of user recognition according to different feature combination. Simulation results show that the method has higher recognition accuracy rate compared with traditional method based on Bayes classifier.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3