新型的Web使用挖掘数据预处理方法  被引量:2

Novel data preprocessing method for Web usage mining

在线阅读下载全文

作  者:许芳 李媛[2] 

机构地区:[1]武警后勤信息中心,北京100089 [2]武警北京指挥学院信息技术与装备教研室,北京100012

出  处:《信息技术》2016年第4期193-195,200,共4页Information Technology

摘  要:大数据背景下,Web使用挖掘的目的是通过识别Web数据使用模式更好地为Web应用需求提供服务,高效地处理大数据并从中找到有用的信息,数据预处理是保证Web使用挖掘数据质量的必要阶段。首先,论述了Web使用挖掘数据预处理领域的相关工作;其次提出了在数据挖掘开始之前的接入流数据预处理技术,这项技术能通过识别单独用户和会话来提高数据预处理的性能;最后进行了实验验证。结果表明,文中方法有助于发现来自于用户数据流的有意义的模式和关系,因此具有可行性和有效性。The aim of Web usage mining is to serve the requirements of the Web applications by identifying usage patterns of the Web data,but data preprocessing is the inevitable stage for guaranteeing the quality of data and continuous mining in Web usage mining. Firstly,the relative works in the field of data preprocessing of Web usage mining is reviewed. Secondly,the data preprocessing technique of access stream before the start of data mining is proposed,this technique can improve the performance of data preprocessing by identifying unique users and unique sessions. Finally,the proposed method is verified by the experiment. The results show that the proposed method helps in finding out the meaningful patterns and relationships from user's data streams,so it is feasible and effective method.

关 键 词:WEB使用挖掘 大数据 数据预处理 数据清理 

分 类 号:TP393[自动化与计算机技术—计算机应用技术] TP311.13[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象