基于相邻字对信息的中文文档分类研究被引量：2

CHINESE DOCUMENT CATEGORIZATION BASED ON ADJACENT CHINESE CHARACTER-PAIRS INFORMATION

作　　者：周水庚[1] 俞红奇[1] 胡江滔[1] 付辛[1] 胡运发[1]

机构地区：[1]复旦大学计算机系,上海200433

出　　处：《小型微型计算机系统》2001年第4期462-466,共5页Journal of Chinese Computer Systems

基　　金：国家自然科学基金资助项目!"电子图书馆的相关关键技术"(6 99330 10 );国家 86 3计划资助项目!"智能图书馆系统"(86 3-30 6 -ZT0 4-

摘　　要：本文首次提出利用相邻字对信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现中文文档分类的领域无关性和时间无关性 .分别利用 Naive Bayes和 k NN分类方法建立了基于相邻字对信息的中文文档分类系统 .Categorization is an efficient way to organize massive documents in our information age. Current Chinese text classifiers are based on

关键词：文档分类属性选择相邻宇对 kNN法中文文档分类信息处理

分类号：TP391.12[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于相邻字对信息的中文文档分类研究被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于相邻字对信息的中文文档分类研究 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于相邻字对信息的中文文档分类研究被引量：2