基于时间戳间距的用户在线时长聚类方法  

Method of user online duration clustering based on timestamp interval

在线阅读下载全文

作  者:叶倩 高明 田亮亮 韦雨萌 刘翼[2] YE Qian;GAO Ming;TIAN Liangliang;WEI Yumeng;LIU Yi(Department of Educational Administration,Yan’an University,Yan’an 716000,China;College of Mathematics and Computer Sciences,Yan’an University,Yan’an 716000,China)

机构地区:[1]延安大学教务处,陕西延安716000 [2]延安大学数学与计算机科学学院,陕西延安716000

出  处:《现代电子技术》2024年第16期47-50,共4页Modern Electronics Technique

基  金:国家自然科学基金项目(62262067);国家自然科学基金项目(61962059);陕西省教育厅自然科学专项(22JK0622);延安市科技计划项目(2022SLGYGG-007);陕西教育教学改革研究项目(23BY071);延安大学教学改革重点项目(YDJGZD22-02)。

摘  要:在网络用户行为分析中,以时序维度为基础,研究用户网络行为的变化趋势,提出并挖掘更多有价值的信息,可为管理或商业决策提供有力支持。为此,文中提出一种基于时间戳间距的用户在线时长聚类方法,以用户访问日志文件中时间戳之间的间距作为特征,首先将获取的日志数据进行预处理,获得用户的在线时长统计;然后采用K-Means聚类算法对用户进行聚类,并使用轮廓系数对K值进行评价分析,确定聚类K值范围,准确判定用户单次访问在线时长及类型。采用真实校园网用户访问日志数据对所提方法进行评价,实验结果表明,该方法的准确度达到0.9180,精确度达到0.7685,召回率达到0.8093。In the analysis of online user behavior,based on the temporal dimension,the changing trend of user network behavior is studied,and more valuable information is proposed and explored,which can provide strong support for management or business decision-making.On this basis,a method of user online duration clustering based on timestamp interval is proposed,with the interval between timestamps in user access log file as a feature.The obtained log data is preprocessed to obtain the statistics on user online duration.The K-Means clustering algorithm is used to cluster user,and the silhouette coefficient is used to evaluate and analyze the K value within the range,determine the range of K value,and accurately determine the online duration and type of user’s single visit.The proposed method was evaluated by using real campus network user access log data.The experimental results show that the accuracy of this method can reach 0.9180,the accuracy can reach 0.7685,and the recall rate can reach 0.8093.

关 键 词:用户在线时长 用户聚类 K-MEANS聚类算法 数据预处理 时间戳间距 轮廓系数 

分 类 号:TN929.5-34[电子电信—通信与信息系统] TP393[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象