检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海大学计算机工程与科学学院,上海200072
出 处:《计算机工程与设计》2010年第17期3864-3867,共4页Computer Engineering and Design
基 金:国家自然科学基金项目(60975033;60575035);上海市重点学科建设基金项目(J50103);上海大学创新基金项目(SHUCX092161)
摘 要:在应用SVM对文本进行分类时,用传统的TFIDF算法对文本特征进行选择会产生高维特征向量问题,这个问题干扰了SVM的效率和准确性,使SVM的性能下降。为了解决SVM文本分类过程中产生的这个问题,提出一种基于本体的特征项约简方法。该方法通过本体找出特征向量中具有同义关系、组成关系和上下位关系的冗余特征项,然后对它们进行合并降低特征向量的维数。试验结果表明,采用本体约简特征向量的方法改进了SVM分类器的性能。Using the tradition algorithm of TFIDF to select text feature in the process of applying SVM to classify text,a problem of high dimension feature vector is caused.The problem interferes with efficiency and accuracy of SVM and it make the performance of SVM drop.A method based on ontology for reducing high dimension of feature vector is proposed.The method can identity feature items of the relations of synonyms,holonymy and hyponymy by ontology in feature vector and merge them to reduce the dimension of feature vector.The experiment shows that the method based on ontology for reducing high dimension of feature vector can improve the performance of SVM classifier.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249