检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王艳[1,2] 乐嘉锦[3] 孙捷[1] 姜久雷[1]
机构地区:[1]东华大学旭日工商管理学院,上海200061 [2]上海海洋大学信息学院,上海201306 [3]东华大学计算机科学与技术学院,上海201620
出 处:《计算机工程与应用》2012年第13期138-143,共6页Computer Engineering and Applications
摘 要:隐私保护的数据挖掘近年来已经为数据挖掘的研究热点,Web网站的服务器日志保存了用户访问页面的信息,如果不加以保护会导致用户隐私数据的泄漏。针对这个问题,讨论了在Web数据挖掘中用户行为的隐私保护问题,进而提出一种将Web服务器日志信息转换成关系数据表的方法,并通过随机化回答方法产生干扰数据表项中信息,再以此为基础,提供给数据使用者进行频繁项集以及强关联规则的发现算法,从而得到真实保密的网上购物篮商品间的关联规则。经实验证明,提出的Web使用挖掘中的隐私保护关联规则挖掘算法隐私性较好,具有一定的适用性。Data mining based on privacy preservation has become a research hot point now. Web server logs save the information of the customer access to page, there will be leaking users' privacy data if not to protect. This paper discusses the privacy protection of customer act in the Web data mining, and puts forward a method to convert the information of Web server log into relational data tables, and through randomized response methods interfere with the data information, then presents the frequent itemsets and strong association rules discovery algorithm and derives the association rules of online shopping basket. The experimental results validate the algorithms by applying it on real datasets.
关 键 词:数据挖掘 会话识别 隐私保护 关联规则 WEB日志
分 类 号:TP309.2[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145