WWW上的信息挖掘技术及实现  被引量:120

THE TECHNOLOGY IMPLEMENTATION OF INFORMATION MINING ON WWW

在线阅读下载全文

作  者:邹涛[1,2] 王继成[1,2] 朱华宇[1,2] 金翔宇[1,2] 张福炎[1,2] 

机构地区:[1]南京大学计算机科学与技术系 [2]南京大学计算机软件新技术国家重点实验室

出  处:《计算机研究与发展》1999年第8期1019-1024,共6页Journal of Computer Research and Development

基  金:江苏省科委"九五"科技攻关项目基金

摘  要:随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源.但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确快捷地从WWW上获取所需信息.文中将数据挖掘的思想引入WWW信息处理领域来解决网上信息有效获取的问题,讨论了在WWW上进行信息挖掘所采用的算法和策略,最后简要介绍了一个采用向量空间模型和改进Robot技术的网络信息挖掘系统的设计与实现.经实验表明,系统能够较好地解决WWW上的信息自动获取问题.With the development of Internet, World Wide Web has become a huge distributed information space, which provides users a massive and valuable information resources. But with Web's rapid growth, quickly obtaining what users need on WWW is getting more difficult because of Internet's opening and heterogeneity. Information mining on WWW is a new technology that adopts data mining technology to retrieve information on Internet, and can solve the problem of rich data and poor information in WWW. Described in this paper are the method, algorithm and strategy of information mining on WWW. The design and implementation of a prototype system, which adopts vector space model and modified Robot technology, are presented.

关 键 词:信息收集 数据处理 VSM WWW 信息检索系统 

分 类 号:G354.4[文化科学—情报学] TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象