检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖州师范学院信息工程学院,湖州313000 [2]宁波大学网络中心,宁波315211
出 处:《情报学报》2007年第5期723-727,共5页Journal of the China Society for Scientific and Technical Information
基 金:国家自然科学基金资助项目(60573056),浙江省自然科学基金重点资助项目(Z106335),浙江省自然科学基金(Y105625).
摘 要:互联网已经成为最大的非结构化数据库,极大方便了信息访问.然而,网络上的信息大多都是无组织的,由于网络的分布式特性,很难对它进行信息和知识管理.因此,如何建立一个智能的信息发现机制很有必要.本文在分析了爬虫工作原理和传统算法后,提出了一种基于本体的网络爬虫的信息发现框架.该框架包含了预处理模块和本体管理模块,定义了网页相关度计算策略,最后通过实验对该框架进行了评估.The Web, the largest unstructured database of the world, has greatly improved access to information. However, information on the Web is largely disorganized. Due to the distributed nature of the World Wide Web it is difficult to use it as a tool for information and knowledge management. Therefore, user doing the difficult task of exploring the Web has to be supported by intelligent means. This paper proposes an approach for information discovery building on a comprehensive framework for ontology-based web crawler. Our framework includes preproeessing module and ontology management module. It defines a relevance computation strategies of the web page and provides an empirical evaluation which has shown premising results.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222