一种改进的基于树路径匹配的网页结构相似度算法  被引量:7

An Improved Web Structure Similarity Based on Matching Algorithm of Tree Paths

在线阅读下载全文

作  者:廖浩伟[1] 杨燕[1] 贾真[1] 尹红风[1] 

机构地区:[1]西南交通大学信息科学与技术学院,成都610031

出  处:《吉林大学学报(理学版)》2012年第6期1199-1203,共5页Journal of Jilin University:Science Edition

基  金:国家自然科学基金(批准号:61152001:61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题基金(批准号:20110102);中央高校基本科研业务费专项基金(批准号:SWJTU11ZT08)

摘  要:提出一种改进的基于树路径匹配的网页结构相似度算法,该算法定义了树路径的序列相似度和位置相似度,找出网页的树路径集合,通过网页间的最佳树路径匹配计算结构相似度.实验结果表明,用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际,更合理有效.An improved algorithm of Web structure similarity based on tree path matching was proposed, which defines the sequence similarity and position similarity of the tree path, finds out all the Web tree paths, and calculates the structural similarity by best tree path matching between two Web pages. Experiments show that the proposed algorithm to calculate the Web structure similarity is more realistic and effective than the original algorithm.

关 键 词:网页结构相似度 序列相似度 位置相似度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象