检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王琳[1] 陈伟萍[2] 封化民[3] 方勇[1,4] 杨鼎才[2]
机构地区:[1]北京邮电大学电信工程学院 [2]燕山大学 [3]北京电子科技学院信息安全与保密重点实验室 [4]北京电子科技学院信息安全与保密重点实验室,北京100070
出 处:《北京电子科技学院学报》2006年第2期10-14,共5页Journal of Beijing Electronic Science And Technology Institute
基 金:国家自然科学基金资助项目(项目编号:60472082)
摘 要:基于中文文本分类的定义和向量空间模型,本文分析了正确分类文本的关键所在。通过对传统的特征选择方法的分析,提出了新的特征选择方法。通过支撑向量机对中等规模语料库的实验,验证了此方法的有效性。Based on the definition of text categorization and VSM (Vector Space Model), this paper analyzes the key points of correctly categorizing texts. After analyzing the conventional feature selection methods, a new feature selection method was proposed. Experiment result on a mid-size corpus With Support Vector Machine shows the effectiveness of the method.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222