中文网页分类研究与系统实现  被引量:12

Study and System Implementation of Chinese Web-page Classification

在线阅读下载全文

作  者:段军峰[1] 黄维通[1] 陆玉昌[1] 

机构地区:[1]清华大学计算机科学与技术系,北京100084

出  处:《计算机科学》2007年第6期210-213,共4页Computer Science

基  金:国家自然科学基金项目(60473115)资助。

摘  要:近年来,网页分类研究逐渐成为网络挖掘和文本挖掘的研究热点,针对中文网页分类的研究也日益增多。本文详细介绍了一个中文网页分类系统的设计与实现,并且提出了一些网页预处理和特征处理的方法。实验结果表明,本文的方法可以使中文网页分类性能由81.5%提高至94.9%。Web-page classification has become a hotspot in the fields of Web mining and text mining in recent years. Studies towards Chinese Web-page are more and more. A detailed design and implementation of a Chinese Web-page classification system is introduced, and some methods on Web-page preprocessing and feature processing are proposed. Experimental results show that the proposed methods can improve the effectiveness of Chinese Web-page classification from 81.5% to 94. 9%.

关 键 词:中文网页分类 网页预处理 特征抽取 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象