网页信息提取

作品数:13被引量:70H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张瑞雪李文立宋明秋王江王彦力更多>>
相关机构:大连理工大学北京大学北京邮电大学浙江工业大学更多>>
相关期刊:《西藏大学学报(社会科学版)》《情报学报》《中国科技信息》《兵工自动化》更多>>
相关基金:国家自然科学基金浙江省自然科学基金辽宁省自然科学基金国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=兵工自动化x
条 记 录,以下是1-1
视图:
排序:
基于HtmlParser的网页信息提取被引量:4
《兵工自动化》2007年第7期41-41,56,共2页李伟 黄颖 
基于HTMLParser对HTML进行网页解析,可抽取标签间的Link、image、meta和title等信息。即使用HtmlParser来提取网页当中的超链接信息,提取首页URL信息,分析所有URL对应的页面并提取Link信息,信息清洗后存入SQL数据库当中,以备后续工作使用。
关键词:HTMLPARSER 信息抽取 网页解析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部