严华梁

作品数:2被引量:14H指数:2
导出分析报告
供职机构:北京大学更多>>
发文主题:抽取方法WEB数据抽取WEB页面翻页更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《软件学报》《计算机工程》更多>>
所获基金:国家高技术研究发展计划中国博士后科学基金中国科学技术信息研究所预研基金项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
一种统一的Web新闻对象自动抽取方法被引量:4
《计算机工程》2012年第11期167-169,共3页刘伟 严华梁 
国家"863"计划基金资助项目(2008AA01Z421);中国科学技术信息研究所预研基金资助项目(YY-201103)
提出一种统一的Web新闻对象自动抽取方法。通过抽取新闻页面中的分类、标题、发布时间、来源、作者、内容、相关评论链接和相关新闻链接作为分类属性,经页面解析、候选值抽取、真值识别3个步骤,实现新闻对象的自动抽取。实验结果表明,...
关键词:WEB数据抽取 视觉特征 序列标注 网页模板 新闻属性 新闻对象 
一种Web评论自动抽取方法被引量:12
《软件学报》2010年第12期3220-3236,共17页刘伟 严华梁 肖建国 曾建勋 
国家高技术研究发展计划(863)No.2008AA01Z421;中国博士后科学基金Nos.20080440256,200902014~~
Web用户评论是许多重要应用的信息来源,比如公众舆情的检测与分析,Web用户评论必须从网页中准确地抽取出来.用户生成内容(user-generated content)不受页面模板的限制,这就给Web数据抽取提出了新的挑战:首先,不同用户评论内容的不一致...
关键词:Web用户评论 结构化数据记录 WEB数据抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部