站点主题结构与导航归纳技术  被引量:1

Website topic structure and navigation induction

在线阅读下载全文

作  者:于龙[1] 尹浩[1] 

机构地区:[1]解放军理工大学通信工程学院,江苏南京210007

出  处:《国防科技大学学报》2012年第5期90-95,共6页Journal of National University of Defense Technology

基  金:国家自然科学基金资助项目(60903042);国家863高技术资助项目(2010AA)

摘  要:站点主题描述了互联网站点中信息的聚合与分类,体现着信息逻辑结构,是分析站点信息的关键。分析站点逻辑结构是站点设计的逆向过程,为了准确分析站点中的主题,提出了站点主题结构的理论模型,以形式化的方式描述了站点中不同主题的组织形式、逻辑关系及相关性质,为面向主题的网络信息抽取提供必要的理论基础。在此基础上,进一步研究自动构建站点主题结构的技术,提出基于导航的主题结构归纳方法,并进行了算法描述和实验分析。实验结果证明,站点主题结构的理论模型概括了目前大多数站点的主题结构特征,基于导航的主题结构归纳方法能正确地建立站点的主题结构,并具有较快的运行时间。Website topics,describing aggregation and classification of website information,embodying information logic structure,is crucial for website information analysis.Analysis of logical structure is the reverse process of website design.In order to accurately analyze the site topics,the research proposed a topic structure model describing the organizational forms,logic relations and related properties of different website's topics in a formal way,providing the necessary theoretical basis for the topic oriented web information extraction.On this basis,navigation-based topic structure induction was proposed with algorithm and experimental analysis to automatically construct topic structure of websites.Experimental results show that topic structure model generalizes most of the site's topic structural characteristics,while the navigation based topic structure induction can correctly establish the site's topic structure,and has a faster running time.

关 键 词:站点 主题结构 导航 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象