Web日志挖掘与Web结构挖掘相结合的挖掘过程  

Mining Processing of Web Log Mining and Web Structure Mining

在线阅读下载全文

作  者:刘丽娜[1] 付帅[1] 

机构地区:[1]东北师范大学人文学院,长春130117

出  处:《电脑编程技巧与维护》2014年第8期88-89,共2页Computer Programming Skills & Maintenance

基  金:吉林省教育厅"十二五"科学技术研究项目:吉教科合字[2014]第638号

摘  要:Web挖掘常常被分成Web内容挖掘、Web结构挖掘和Web使用挖掘三类。Web使用挖掘又称为Web日志挖掘,是指从万维网用户的导航行为中发现有价值的信息的一种数据挖掘技术。Web日志挖掘一般有4个步骤:数据预处理、挖掘过程、模式分析和知识发现。数据预处理是对网站日志文件中的数据进行整理,清洗不完全的、杂乱的、噪声数据;模式分析是指提取用户不感兴趣的信息,并找到用户感兴趣的模式的过程;知识发现是指从日志文件中收集并发现有用知识的统计。主要介绍Web日志挖掘与Web结构挖掘相结合来完成挖掘过程及其应用。Web mining can be classified into three main areas: Web content Mining, Web structure Mining and Web Usage Mining. Web Usage Mining as Web log Mining, which is technology of data mining to find valuable information from navigation behavior of World Wide Web users. There are four main steps: Date Preprocessing, Mining Processing, Pattern analysis and Knowledge discovery. Date Preprocessing cleans log file of website by removing incomplete, unorderly and noise date; the main function of Pattern analysis is to filter uninteresting information and to find process of interesting pattern to users; The Knowledge discovery is the statistics collected using knowledge from Web log file. The text address mining processing of Combining Web Log Mining with Web Structure Mining and its application.

关 键 词:WEB挖掘 网络站点 点击率 日志文件 应用 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象