网络日志挖掘

作品数:9被引量:52H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:王勇茹立云张敏钮心忻沈红斌更多>>
相关机构:清华大学搜狐公司武汉大学北京邮电大学更多>>
相关期刊:《现代电子技术》《硅谷》《广西师范大学学报(自然科学版)》《电子科技》更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划青年科技基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-9
视图:
排序:
基于Hadoop的网络日志挖掘方案的设计被引量:4
《现代电子技术》2017年第9期115-120,共6页许抗震 吴云 
国家自然科学基金项目(NSF61370161);贵州省科学技术基金项目(黔科合J字[2010]2100);贵州大学博士基金项目(贵大人基合字(2009)029)
提出一种挖掘指数级别网络日志数据的解决思路,设计了一个高可靠的网络日志数据挖掘方案。针对现有的公开网络日志数据集,在数据预处理阶段实现了基于Map Reduce的过滤算法,并且挖掘出支持企业决策的服务信息。对该方案搭建的平台进行...
关键词:网络日志 数据挖掘 数据清洗 HADOOP MYSQL 
基于关联规则的网络行为分析被引量:6
《电子科技》2015年第9期16-18,22,共4页刘宗成 张忠林 田苗凤 
甘肃省科技支撑计划基金资助项目(1104GKCA016)
网络用户访问网站的过程中,产生了大量的用户浏览网页的相关记录,隐含着用户在上网过程中的行为习惯。但其中潜在的用户信息难以发现。因此,急需有效的方法提取这些数据中的信息,数据挖掘应用而生。其中,关联规则技术是应用广泛的技术...
关键词:APRIORI算法 网络日志挖掘 关联规则 行为分析 
网络日志预处理中优化的会话识别算法被引量:4
《计算机仿真》2011年第4期123-125,171,共4页杨富华 
研究网络日志预处理中会话识别问题,会话识别是网络日志数据预处理中最重要的一个环节。为使用户准确快速地找到需要的资源,传统网络日志预处理方法采用固定阈值会话识别算法,不能适合网络日志的动态性和不能很好消除网络日志中的冗余信...
关键词:网络日志挖掘 会话识别 数据预处理 数据挖掘 
网络日志挖掘技术探究
《硅谷》2010年第14期63-64,共2页李明 
随着网络信息的迅速增长,网络日志的数据量也成几何级数增长,而这些日志是具有一定的利用价值的。做为一种数据挖掘技术应用的网络日志挖掘就是对网络日志价值的一种利用方式。介绍网络日志挖掘技术的背景、定义,描述网络日志挖掘技术...
关键词:网络日志挖掘 数据挖掘 
基于用户兴趣的个性化推荐被引量:1
《光盘技术》2009年第7期19-21,共3页郭正恩 
随着Internet技术的发展和日益普及,网络信息呈指数级增长。为用户提供准确、有效的个性化推荐信息,在Web信息检索领域获得了广泛关注,在实际的个性化服务系统中也得到了广泛应用。本文分析了传统协同过滤算法中存在的问题,对其相似性...
关键词:网络日志挖掘 用户兴趣模型 协同过滤 个性化推荐 
基于用户兴趣分析的网页生命周期建模被引量:5
《中文信息学报》2008年第2期76-80,共5页王勇 刘奕群 张敏 马少平 茹立云 
国家973重点基础研究资助项目(2004CB318108);国家自然科学基金资助项目(60621062,60503064,60736044);国家863高科技计划资助项目(2006AA01Z141)
网页在其生命周期内的活跃程度会随时间发生变化。有的网页只在特定的阶段有价值,此后就会过时。从用户的角度对网页的生命周期进行分析可以提高网络爬虫和搜索引擎的性能,改善网络广告的效果。利用一台代理服务器收集的网页访问量信息...
关键词:计算机应用 中文信息处理 用户行为分析 网页生命周期 网络日志挖掘 
一种网络日志挖掘的高效算法被引量:2
《广西师范大学学报(自然科学版)》2006年第1期26-29,共4页张兵 
国家自然科学基金资助项目(60463003);北京市教育委员会科技发展计划项目(KM200510016002)
提出了一种网络日志挖掘算法PWU,其采用了异构树结构。通过对异构树叶子节点进行编号,使得对候选集计数时只需对具有相同编号的叶子节点进行计数,极大地简化了候选集计数过程。在此基础上,算法还具有增量挖掘功能。最后,从理论分析和实...
关键词:网络日志挖掘PWU算法 增量挖掘 
网络日志挖掘中基于时间间隔的会话切分被引量:24
《清华大学学报(自然科学版)》2005年第1期115-118,共4页庄力可 寇忠宝 张长水 
针对网络日志挖掘中的会话切分问题,提出了一种基于时间间隔的方法。该方法在相邻页面访问时间间隔超出某阈值时切分会话,针对特定IP的阈值根据其频率矢量来定义。实验表明:代理服务器IP和单用户IP的频率矢量具有不同特性,代理服务器IP...
关键词:数据库理论 网络日志挖掘 会话切分 时间间隔 频率矢量 
本地缓存和代理服务器环境下的网络日志挖掘被引量:6
《计算机工程》2003年第5期46-48,共3页李毅 李石君 
国家自然科学基金项目(60173045); 武汉大学青年科技基金项目(9910)
介绍了网络日志挖掘的基本概念,提出了一个网络日志挖掘通用系统的结构,分析了本地缓存和代理服务器对日志挖掘的影响,并给出了一种近似解决方案。这种方案通过网络拓扑结构和日志文件记录的结合,将杂乱无章的日志记录组合成具有语...
关键词:网络日志 数据挖掘 本地缓存 代理服务器 WWW 计算机网络 
检索报告 对象比较 聚类工具 使用帮助 返回顶部