基于内容的网页信息挖掘原理和设计  

Principle and Implementation of Information Mining Based on Content

在线阅读下载全文

作  者:张义忠[1] 赵明生[1] 梁久祯[1] 

机构地区:[1]清华大学电子工程系,北京,100084 清华大学电子工程系,北京,100084 清华大学电子工程系,北京,100084

出  处:《测试技术学报》2002年第z2期1479-1484,共6页Journal of Test and Measurement Technology

基  金:本课题得到清华大学985项目,国家自然科学基金(60003014)资助

摘  要:本文主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取.通过对旅游类网页的实验结果显示,本文的方法和应用效果良好.

关 键 词:信息挖掘 特征提取 超链信息 

分 类 号:TB9-55[一般工业技术—计量学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象