基于改进VSM的大规模真实文档自动分类系统的研究和实现  

Research and Development of Large-scale Real Document Automatic Classification System Based on Revised VSM

在线阅读下载全文

作  者:蒋晓冬[1] 金宇晖[1] 强庆华 

机构地区:[1]南京大学计算机科学与技术系

出  处:《现代计算机》1998年第3期10-13,共4页Modern Computer

摘  要:随着Internet和光盘等大容量存储技术的迅速发展,如何迅速、有效地从大量信息中找到所需的信息已成为一个迫切需要解决的问题。文档自动分类系统就是将文档自动归到一个或几个文档类别中去,这一技术的发展将在信息检索、邮件分类、电子会议、信息过滤等许多环境中得到广泛应用。本次首次对传统的文档内容表示方法VSM(向量空间模型)作出改进,并针对系统特点提出了具体的分类算法。目前,本系统已初步实施完成并应用于江苏省“九五”重点攻关课题──“Internet数字图书馆”之中,取得了良好的效果。With the development of Internet and large-scale storage technology, how to facilitate fast and effective information retrieval has become an urgent problem.To solve this problem,the automatic classification system is developed and has found wide applications in data mining ,mail categorization, electronic conference and information filtering. This paper originally pro poses a revised VSM(Vector Space Model)as the model for document and discusses in detail the algorithm for classifica tion.At the end of the paper,we propose an implementation prototype of this system and its application in the national key project“Digital Library on lnternet' sponsored by the Ninth Five - Year - Plan grant.

关 键 词:VSM 文档分类系统 INTERNET网 数字图书馆 

分 类 号:TP393[自动化与计算机技术—计算机应用技术] G25[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象