检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军理工大学通信工程学院,江苏南京210007
出 处:《国防科技大学学报》2012年第5期90-95,共6页Journal of National University of Defense Technology
基 金:国家自然科学基金资助项目(60903042);国家863高技术资助项目(2010AA)
摘 要:站点主题描述了互联网站点中信息的聚合与分类,体现着信息逻辑结构,是分析站点信息的关键。分析站点逻辑结构是站点设计的逆向过程,为了准确分析站点中的主题,提出了站点主题结构的理论模型,以形式化的方式描述了站点中不同主题的组织形式、逻辑关系及相关性质,为面向主题的网络信息抽取提供必要的理论基础。在此基础上,进一步研究自动构建站点主题结构的技术,提出基于导航的主题结构归纳方法,并进行了算法描述和实验分析。实验结果证明,站点主题结构的理论模型概括了目前大多数站点的主题结构特征,基于导航的主题结构归纳方法能正确地建立站点的主题结构,并具有较快的运行时间。Website topics,describing aggregation and classification of website information,embodying information logic structure,is crucial for website information analysis.Analysis of logical structure is the reverse process of website design.In order to accurately analyze the site topics,the research proposed a topic structure model describing the organizational forms,logic relations and related properties of different website's topics in a formal way,providing the necessary theoretical basis for the topic oriented web information extraction.On this basis,navigation-based topic structure induction was proposed with algorithm and experimental analysis to automatically construct topic structure of websites.Experimental results show that topic structure model generalizes most of the site's topic structural characteristics,while the navigation based topic structure induction can correctly establish the site's topic structure,and has a faster running time.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3