WEB数据抽取

作品数:33被引量:98H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李贵韩子扬李征宇蔡益清古晓洪更多>>
相关机构:沈阳建筑大学山东大学国防科学技术大学东北师范大学更多>>
相关期刊:《郑州大学学报(理学版)》《泉州师范学院学报》《能源与环保》《计算机科学与应用》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划福建省重点科技计划项目福建省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
煤矿安全Web数据采集技术研究及应用被引量:1
《能源与环保》2024年第10期14-20,共7页吴克介 
天地科技创新创业资金专项项目(2023-TD-QN010);2022年新疆维吾尔自治区第三批重点研发任务专项—厅厅、厅地联动项目(2022B03031-3-1);国家重点研发计划项目(2018YFC0808300);重庆市技术创新与应用发展专项重点项目(cstc2019jscx-mbdxX0007)。
针对矿井安全分析所需的事故、处罚等不易获取的数据,选择互联网公开的Web数据作为数据源,在分析总结Web查询结果页面具有的视觉特征基础上,提出了一种基于视觉与DOM树的Web数据抽取方法(VDLE)。首先,引入视觉块重心偏移量定位数据区域...
关键词:视觉 DOM树 WEB数据抽取 煤矿安全 事故分析 
基于可视块的多记录型复杂网页信息提取算法被引量:13
《计算机科学》2019年第10期63-70,共8页王卫红 梁朝凯 闵勇 
浙江省自然科学基金(LY17G030030,LGF18D010001,LGF18D010002)资助
网页具有丰富的内容和复杂多变的结构,现有的网页信息提取技术解决了单记录型简单页面的信息提取问题,但是对于多记录型复杂页面的信息提取效果往往不佳。文中提出了一种全新的基于可视块的复杂网页信息自动化提取算法(Visual Block Bas...
关键词:WEB数据抽取 WEB挖掘 数据记录提取 网页数据提取 结构化信息 
面向开源社区的Web数据抽取方法研究
《现代计算机》2017年第3期27-29,39,共4页张方 尹刚 王涛 余跃 
由协同开发社区和知识分享社区所组成的开源社区中汇集海量的开源数据资源。如何从数量众多,页面结构各异的开源社区中准确、高效地获取这些数据是对开源数据资源进行全面分析,深度关联的前提。阐述面向开源社区的Web数据抽取方法研究过...
关键词:开源社区 WEB数据抽取 协同开发社区 知识共享社区 
基于领域模式的Web数据抽取与集成系统研究与实现
《计算机科学与应用》2016年第4期203-215,共13页李贵 耿传杰 韩子扬 李征宇 
辽宁省自然科学基金项目(2014020068)。
提供面向领域的信息增值服务是Web数据挖掘的目标之一,面向领域的Web数据抽取与集成是提供领域信息增值服务的基础,也是Web数据挖掘领域的一个主要研究方向,结合领域需求,本文提出一种面向领域的Web数据抽取与集成架构,在给出Web数据模...
关键词:Web数据模型与模式 领域数据模型与模式 领域数据抽取与集成 领域增值服务 
Web数据抽取技术的研究和探讨被引量:1
《电子世界》2015年第13期36-37,共2页仇岗 杨琴 
Web信息抽取与数据挖掘技术及其在网络舆情监测中的应用研究;项目编号:2012YJQT03
随着电子商务的迅猛发展,网络购物受到了大多数人的青睐,怎么样才能从众多的购物网站中找到自己需要的产品,是数据抽取技术的焦点。由于Web数据具有半结构化的特征,使得数据抽取技术更加复杂。如何发展Web数据抽取技术要充分利用网络资...
关键词:WEB数据抽取 XPATH 信息抽取 模型 
基于视觉信息和标签路径的数据抽取
《中国海洋大学学报(自然科学版)》2015年第5期114-119,共6页张巍 邹晓明 谈凤真 
山东省自然科学基金项目(ZR2012FM016)资助
结合网页的视觉信息和DOM树结构,研究从Deep Web查询结果页面中抽取半结构化数据的问题。通过视觉块与整个网页的面积比定位数据区域。根据数据记录两两相邻等视觉特征找到包含数据记录的一组节点,并通过比较各节点的DOM树结构的相似度...
关键词:DEEP WEB数据抽取 视觉信息 标签路径 
基于文献的农业领域本体自动构建方法研究被引量:11
《计算机应用与软件》2014年第8期71-74,共4页王超 李书琴 肖红 
十二五科技支撑项目(2011BAD21D21B05;2012BAH30F00)
农业领域本体的构建将为农业垂直搜索引擎提供知识组织基础。在对本体构建技术进行深入研究的基础上,设计实现基于文献的农业领域本体构建方法。使用Web数据抽取技术获取农业文献,通过对文献分词和清洗,自动提取领域概念,并用关联分析...
关键词:领域本体 本体构建 WEB数据抽取 关联分析 改进的层次聚类算法 
基于DOM的Web数据抽取研究被引量:1
《科技创新与应用》2013年第18期77-77,共1页郭东峰 
文章阐述了利用XML中的DOM树将Web数据结构分析,转化为结构化的XML数据,使用Xpath实现数据匹配查找数据,通过正则表达式实现数据抽取。同时,对目前数据抽取技术做一些简单探讨研究。
关键词:数据抽取 XML数据 DOM树 
面向领域的Web数据抽取与集成被引量:1
《计算机科学》2013年第06A期157-159,175,共4页李贵 李征宇 陈韶刚 韩子扬 孙平 孙焕良 
国家自然科学基金(61070024)资助
面向领域的Web数据挖掘包括领域Web数据抽取和领域Web数据集成。针对领域数据抽取,提出了Web结构数据模型和Web表模式,给出了Web表定位和数据记录抽取的算法,针对领域Web数据集成,提出了基于领域模型的数据集成算法。结合行业领域的实...
关键词:Web结构数据模型 Web表模式 领域模型 领域数据抽取与集成 
一种统一的Web新闻对象自动抽取方法被引量:4
《计算机工程》2012年第11期167-169,共3页刘伟 严华梁 
国家"863"计划基金资助项目(2008AA01Z421);中国科学技术信息研究所预研基金资助项目(YY-201103)
提出一种统一的Web新闻对象自动抽取方法。通过抽取新闻页面中的分类、标题、发布时间、来源、作者、内容、相关评论链接和相关新闻链接作为分类属性,经页面解析、候选值抽取、真值识别3个步骤,实现新闻对象的自动抽取。实验结果表明,...
关键词:WEB数据抽取 视觉特征 序列标注 网页模板 新闻属性 新闻对象 
检索报告 对象比较 聚类工具 使用帮助 返回顶部