检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周水庚[1] 关佶红[2] 俞红奇[1] 胡运发[1]
机构地区:[1]复旦大学计算机系,上海200433 [2]武汉大学计算机学院,武汉430072
出 处:《中文信息学报》2001年第1期34-39,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金! ( 6993 30 10 ) ;国家 863计划 !( 863 -3 0 6-ZT0 4 -0 2 -2 )
摘 要:传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和时间无关性。利用kNN分类方法 ,实现了一个基于N gram信息的中文文档分类系统。Traditional document classifiers are based on
关 键 词:N-GRAM信息 属性选择 KNN法 中文文档分类系统 领域无关性 时间无关性
分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.175