基于内容的网页特征提取  被引量:9

Research on Feature Extraction for Content-based Chinese Web Pages Analysis

在线阅读下载全文

作  者:张义忠[1] 赵明生[1] 朱精南[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《计算机工程与应用》2001年第10期1-3,共3页Computer Engineering and Applications

基  金:国家自然科学基金!(编号:60003014);国家863高技术项目!(编号:863-317-01-06-99);清华大学985

摘  要:文章主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取。通过对旅游类网页的实验结果显示,文中的方法和应用效果良好。This paper presents a feature framework for content-based Chinese web page analysis and searching. The method for constructing segmentation keyword dictionary is introduced first. The

关 键 词:网页特征提取 信息检索 数据库 信息资源 知识库 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术] G354.4[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象