检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京大学计算机科学与技术系
出 处:《现代计算机》1998年第3期10-13,共4页Modern Computer
摘 要:随着Internet和光盘等大容量存储技术的迅速发展,如何迅速、有效地从大量信息中找到所需的信息已成为一个迫切需要解决的问题。文档自动分类系统就是将文档自动归到一个或几个文档类别中去,这一技术的发展将在信息检索、邮件分类、电子会议、信息过滤等许多环境中得到广泛应用。本次首次对传统的文档内容表示方法VSM(向量空间模型)作出改进,并针对系统特点提出了具体的分类算法。目前,本系统已初步实施完成并应用于江苏省“九五”重点攻关课题──“Internet数字图书馆”之中,取得了良好的效果。With the development of Internet and large-scale storage technology, how to facilitate fast and effective information retrieval has become an urgent problem.To solve this problem,the automatic classification system is developed and has found wide applications in data mining ,mail categorization, electronic conference and information filtering. This paper originally pro poses a revised VSM(Vector Space Model)as the model for document and discusses in detail the algorithm for classifica tion.At the end of the paper,we propose an implementation prototype of this system and its application in the national key project“Digital Library on lnternet' sponsored by the Ninth Five - Year - Plan grant.
关 键 词:VSM 文档分类系统 INTERNET网 数字图书馆
分 类 号:TP393[自动化与计算机技术—计算机应用技术] G25[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31