基于万有引力定律和PageRank的页面分类系统构建方法研究  

Research on Construction Method of Page Classification System Based on the Law of Universal Gravitation and Page Rank

在线阅读下载全文

作  者:赵文娟[1] 任菊香[1] 

机构地区:[1]山西大学商务学院,山西太原030031

出  处:《情报科学》2015年第6期35-38,共4页Information Science

基  金:国家自然科学基金项目(61202311);山西省高等学校科技创新项目(2014142);全国教育信息技术研究十二五规划课题(146241697);山西大学商务学院科研基金项目(XS2011005)

摘  要:当前文本分类方法由于没有考虑页面之间相互关系,因而分类效率有限。鉴于此,受万有引力定律启发,提出基于万有引力定律和PageRank的页面分类方法。该方法的基本思路是通过分析页面之间的链接关系,将类属未知的页面划分到对其影响较大的一类。以上述分类方法为基础,构建了基于万有引力定律和PageRank的页面分类系统。该系统包括页面预处理、页面向量表示、页面分类以及分类结果评价等模块。真实数据集上的比较实验表明所提方法的有效性。Atthough traditional web page classifiers perform well in practice, they don't take the link connections between web pages into consideration, and therefore, their classification efficiency can't be greatly improved. In view of this, a web page classification method based on the Law of Universal Gravitation and PageRank Algorithm, based on which, we constructs the web page classification system. Our system consists of pre-processing, web page representation, web page classification and performance measures components. Experiments on the authentic dataset verify the effectiveness of the proposed method.

关 键 词:万有引力定律 PAGERANK 页面分类系统 

分 类 号:G254[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象