基于改进VSM的Web文本分类方法  被引量:12

Web Text Classification Approach Based on Improved VSM

在线阅读下载全文

作  者:胡晓[1] 王理[1] 潘守慧[1] 

机构地区:[1]北京航空航天大学图书馆,北京100191

出  处:《情报杂志》2010年第5期144-147,共4页Journal of Intelligence

基  金:国家自然科学基金项目"基于贝叶斯本体的Web知识发现"(编号:70971005)

摘  要:Web文本自动分类技术是Web文本挖掘的关键技术之一。针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特征项加权计算方法。根据特征项在文档中的位置和出现频率计算其权值,并给出了具体的Web文本分类算法和评测方法。经实验验证,改进后系统的微平均查准率均大于0.8,分类性能明显好于改进前。

关 键 词:WEB文本分类 向量空间模型 VSM 文本挖掘 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象