网页信息提取

作品数:13被引量:70H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张瑞雪李文立宋明秋王江王彦力更多>>
相关机构:大连理工大学北京大学北京邮电大学浙江工业大学更多>>
相关期刊:《西藏大学学报(社会科学版)》《情报学报》《中国科技信息》《兵工自动化》更多>>
相关基金:国家自然科学基金浙江省自然科学基金辽宁省自然科学基金国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用研究x
条 记 录,以下是1-2
视图:
排序:
NEMTF:基于多维度文本特征的新闻网页信息提取方法
《计算机应用研究》2022年第4期1043-1048,共6页翁彬月 秦永彬 黄瑞章 任丽娜 田悦霖 
国家自然科学基金通用联合基金重点资助项目(U1836205);国家自然科学基金重大研究计划资助项目(91746116);国家自然科学基金资助项目(62066007,62066008);贵州省科技重大专项计划资助项目(黔科合重大专项字[2017]3002);贵州省科学技术基金重点资助项目(黔科合基础[2020]1Z055)。
目前主流的网页抽取方法存在两大问题:提取信息类型单一,难以获取多种类新闻信息;多依赖HTML标签,难以扩展至不同来源。为此提出一种基于多维度文本特征的新闻网页信息提取方法,利用新闻文本的写作特点划分出写作、语义和位置特征,通过...
关键词:网页信息提取 卷积神经网络 WEB挖掘 文本特征 
基于HTML树和模板的文献信息提取方法研究被引量:7
《计算机应用研究》2010年第12期4615-4617,共3页李文立 王乐超 宋春雷 
国家自然科学基金资助项目(70572099);辽宁省自然科学基金资助项目(1050349)
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将...
关键词:网页信息提取 文档对象模型树 模板 文献信息搜集 
检索报告 对象比较 聚类工具 使用帮助 返回顶部