基于用户访问事务文法的序列关联规则发现  被引量:5

Sequence Association Rule Discovery Based on User Access Transaction Grammar

在线阅读下载全文

作  者:王实[1] 高文[1] 李锦涛[1] 

机构地区:[1]中国科学院计算技术研究所,北京100080

出  处:《软件学报》2001年第10期1503-1509,共7页Journal of Software

基  金:国家重点基础研究发展规划 973资助项目 (G19980 30 40 5 );国家 863高科技发展计划资助项目 (86 3- 30 6 - JD0 6 -0 3- 4)~~

摘  要:在 Web挖掘中 ,应用关联规则发现方法可以发现 Web页面之间用户访问的关联度 .由于 Web站点内含丰富的页面结构信息 ,也由于用户的访问总是要遵循一定的访问顺序 ,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法 .该方法首先得到用户访问事务 ;然后根据正则文法 ,定义了一种新的用户访问事务文法 ,用于从用户访问事务中得到用户序列访问事务 ;最后应用关联规则发现算法进而发现序列关联规则 .为了进一步评价所发现的序列关联规则 ,引入了互信息的概念 .发现的序列关联规则可以帮助 Web站点的设计者更好地理解用户的访问 ,以用于调整In web mining, applying association rule discovery can discover the association between different web pages accessed by users. Because there is the rich structure information in the website and the access of the users conforms to some kinds of sequences, a new approach is presented in this paper to discover the association between the access sequences, which is the sequence association rule discovery. In this approach, the Log is mined in the web server to get the user access transactions, and then according to the regular grammar a new user access transaction grammar is defined in order to get the user sequence access transactions from the user access transactions. Subsequently, the association rule discovery algorithm is employed to discover the sequence association rules. To evaluate these rules, the mutual information is proposed. The result of this approach can help the designer of the website to understand the user access patterns better, and according to this result the designer can adjust the structure of the web site.

关 键 词:WEB 数据挖掘 文法 序列关联规则 数据库 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象