基于Ngram信息的中文文档分类研究  被引量:23

Chinese Documents Categorization Based on N gram Information

在线阅读下载全文

作  者:周水庚[1] 关佶红[2] 俞红奇[1] 胡运发[1] 

机构地区:[1]复旦大学计算机系,上海200433 [2]武汉大学计算机学院,武汉430072

出  处:《中文信息学报》2001年第1期34-39,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金! ( 6993 30 10 ) ;国家 863计划 !( 863 -3 0 6-ZT0 4 -0 2 -2 )

摘  要:传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和时间无关性。利用kNN分类方法 ,实现了一个基于N gram信息的中文文档分类系统。Traditional document classifiers are based on

关 键 词:N-GRAM信息 属性选择 KNN法 中文文档分类系统 领域无关性 时间无关性 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象