基于相邻字对信息的中文文档分类研究  被引量:2

CHINESE DOCUMENT CATEGORIZATION BASED ON ADJACENT CHINESE CHARACTER-PAIRS INFORMATION

在线阅读下载全文

作  者:周水庚[1] 俞红奇[1] 胡江滔[1] 付辛[1] 胡运发[1] 

机构地区:[1]复旦大学计算机系,上海200433

出  处:《小型微型计算机系统》2001年第4期462-466,共5页Journal of Chinese Computer Systems

基  金:国家自然科学基金资助项目!"电子图书馆的相关关键技术"(6 99330 10 );国家 86 3计划资助项目!"智能图书馆系统"(86 3-30 6 -ZT0 4-

摘  要:本文首次提出利用相邻字对信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现中文文档分类的领域无关性和时间无关性 .分别利用 Naive Bayes和 k NN分类方法建立了基于相邻字对信息的中文文档分类系统 .Categorization is an efficient way to organize massive documents in our information age. Current Chinese text classifiers are based on

关 键 词:文档分类 属性选择 相邻宇对 kNN法 中文文档分类 信息处理 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象