王鑫昱

作品数:5被引量:28H指数:2
导出分析报告
供职机构:燕山大学信息科学与工程学院更多>>
发文主题:WEB日志挖掘会话识别数据预处理频繁子树数据挖掘更多>>
发文领域:自动化与计算机技术理学更多>>
发文期刊:《计算机应用与软件》《计算机研究与发展》《计算机工程》《燕山大学学报》更多>>
所获基金:博士科研启动基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
一种基于动态时间阈值的会话识别方法被引量:6
《计算机应用与软件》2010年第2期244-246,共3页戴智丽 王鑫昱 
会话识别是Web日志挖掘的关键步骤,会话识别的质量直接影响后续挖掘的准确性。在Timeout方法固定时间阈值的基础上,提出动态时间阈值,通过对样本日志的分析,得到不同时段的时间阈值。在处理日志文件时,根据当前会话开始记录的访问时间...
关键词:WEB日志挖掘 数据预处理 会话识别 
基于动态分类的Markov用户浏览预测模型被引量:1
《计算机工程》2008年第21期166-168,共3页陈子军 乔良 王鑫昱 
燕山大学博士基金资助项目(B83)
针对多Markov链用户浏览预测模型分类算法的时间复杂度过高问题,提出一种基于动态分类的Markov用户浏览预测模型。该模型通过学习提取用户浏览特征,利用这些特征对用户浏览路径进行分类,实现预测并动态更新用户浏览特征。实验结果表明,...
关键词:浏览预测 用户分类 MARKOV模型 
基于网页特征的会话识别方法被引量:1
《燕山大学学报》2008年第1期10-13,共4页陈子军 王鑫昱 
提出一种利用网页特征进行会话识别的方法。通过分析网页本身的特征,计算站点中所有网页的特征向量。根据这些特征向量,可以计算任意网页之间的相关程度。按照用户请求页面在日志中的时间顺序,可以得到日志中所有直接相邻的页面记录的...
关键词:WEB日志挖掘 数据预处理 会话识别 
一种Web日志会话识别的优化方法被引量:18
《计算机工程》2007年第1期95-97,共3页陈子军 王鑫昱 李伟 
燕山大学博士基金资助项目
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。该文对此提出优化算法,并对最常用的Timeout方法识别的会话进行优化,通过实验证明会话质量得到了提高。
关键词:WEB日志挖掘 数据预处理 会话识别 
基于投影编码的频繁子树挖掘算法被引量:2
《计算机研究与发展》2006年第z3期389-394,共6页陈子军 李伟 李霞 王鑫昱 
燕山大学博士基金项目(B83)
频繁子树挖掘被广泛地应用于Web挖掘、生物信息学、XML数据挖掘等领域.提出一种新的算法--PETreeMiner.算法利用序列中无候选产生的技术--前缀投影技术来挖掘频繁子树.在树的先序遍历序列中加入结点的范围属性,在投影过程中进行编码,使...
关键词:数据挖掘 频繁子树 前缀投影 编码 
检索报告 对象比较 聚类工具 使用帮助 返回顶部