应用本体对特征向量降维研究  被引量:4

Research on reducing dimension of feature vector based on ontology

在线阅读下载全文

作  者:孙荣[1] 刘宗田[1] 廖涛[1] 王利[1] 

机构地区:[1]上海大学计算机工程与科学学院,上海200072

出  处:《计算机工程与设计》2010年第17期3864-3867,共4页Computer Engineering and Design

基  金:国家自然科学基金项目(60975033;60575035);上海市重点学科建设基金项目(J50103);上海大学创新基金项目(SHUCX092161)

摘  要:在应用SVM对文本进行分类时,用传统的TFIDF算法对文本特征进行选择会产生高维特征向量问题,这个问题干扰了SVM的效率和准确性,使SVM的性能下降。为了解决SVM文本分类过程中产生的这个问题,提出一种基于本体的特征项约简方法。该方法通过本体找出特征向量中具有同义关系、组成关系和上下位关系的冗余特征项,然后对它们进行合并降低特征向量的维数。试验结果表明,采用本体约简特征向量的方法改进了SVM分类器的性能。Using the tradition algorithm of TFIDF to select text feature in the process of applying SVM to classify text,a problem of high dimension feature vector is caused.The problem interferes with efficiency and accuracy of SVM and it make the performance of SVM drop.A method based on ontology for reducing high dimension of feature vector is proposed.The method can identity feature items of the relations of synonyms,holonymy and hyponymy by ontology in feature vector and merge them to reduce the dimension of feature vector.The experiment shows that the method based on ontology for reducing high dimension of feature vector can improve the performance of SVM classifier.

关 键 词:文本分类 本体 支持向量机 特征向量 维数约简 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象