检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西安交通大学计算机科学与技术系,陕西西安710049
出 处:《小型微型计算机系统》2002年第1期116-118,共3页Journal of Chinese Computer Systems
摘 要:从 web日志中发现有用的信息是所有 web站点管理者的迫切愿望 ,但 web服务器日志的不准确导致数据准备阶段的复杂性 .在数据挖掘以往的应用领域如 POS数据库中 ,存在着具有自然特征的事务 ,而在 web日志中不但没有这种事务 ,而且还不容易通过分析得到这种事务 .本文首先描述了引用长度事务分割方法的用户浏览行为模型 ,然后针对这种模型提出了两点改进 :增加了网络延时参数和对噪音数据处理的考虑 .改进后的模型能适应网络延时较大且随时间变化的情况 。Web based organizations often generate large volumes of data in their daily operations. Analyzing such data can help these organizations to design marketing strategies, targeting customers in electronic commerce, improve system design and enhance server performance. But the inaccuracy of the Web log leads to the complexity of data preparation phase of Web usage mining. While traditional domains for data mining have naturally defined transactions, there is no convenient method of clustering web references into transactions. After describing a User Browsing Behavior model used in reference length transaction identification approach, the paper presents two improvements on this model: adding a parameter called network delay and introducing the disposal of noise data. The algorithm after improvement can acquire users browsing pattern more exactly.
关 键 词:数据挖掘 事务识别 日志 WEB 数据库 INTENET
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TP393.4[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.147.78.141