基于中文学术期刊人工标引的自动分类新算法  被引量:1

在线阅读下载全文

作  者:王洪[1] 贾惠波[1] 徐端颐[1] 

机构地区:[1]清华大学光盘国家工程研究中心,北京100084

出  处:《现代图书情报技术》2002年第S1期59-62,共4页New Technology of Library and Information Service

基  金:国家重点基础研究973项目(G19990330)

摘  要:为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。

关 键 词:自动分类 人工标引 特征词向量空间 【分类号】 TP391 

分 类 号:G254.1[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象