DOM树

作品数:126被引量:313H指数:9
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李子茂莫海芳帖军吴经龙陈星更多>>
相关机构:福州大学中南民族大学大连理工大学北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
煤矿安全Web数据采集技术研究及应用被引量:1
《能源与环保》2024年第10期14-20,共7页吴克介 
天地科技创新创业资金专项项目(2023-TD-QN010);2022年新疆维吾尔自治区第三批重点研发任务专项—厅厅、厅地联动项目(2022B03031-3-1);国家重点研发计划项目(2018YFC0808300);重庆市技术创新与应用发展专项重点项目(cstc2019jscx-mbdxX0007)。
针对矿井安全分析所需的事故、处罚等不易获取的数据,选择互联网公开的Web数据作为数据源,在分析总结Web查询结果页面具有的视觉特征基础上,提出了一种基于视觉与DOM树的Web数据抽取方法(VDLE)。首先,引入视觉块重心偏移量定位数据区域...
关键词:视觉 DOM树 WEB数据抽取 煤矿安全 事故分析 
基于Web网页的DOM树链接预分类、信息抽取方法研究
《长江信息通信》2023年第11期133-135,共3页罗莎 
为满足Web网页的数据记录、自动抽取需求,提出依托DOM树特征的网页信息链接预分类、领域本体的Web信息抽取方法,根据HTML、XML网页文档结构设置DOM对象节点树,标记网页页码导航节点、前导符节点、数据特征节点,用DOM根节点到目标节点的...
关键词:WEB网页 DOM树特征 信息链接预分类 信息抽取方法 
一种用于Web UI自动化测试脚本修复的网页元素重定位方法被引量:1
《长春师范大学学报》2023年第8期54-59,共6页陈俊生 彭莉芬 
安徽省高校自然科学研究重大项目“大数据分析视域下高职校情数据智能分析平台的创新研究与应用”(KJ2021ZD0172);安徽省质量工程项目“大数据技术教学创新团队”(2021jxtd023);安徽省教学研究重大项目“基于高阶思维能力培养的全过程混合式教学模式构建与应用研究”(2022jyxm111);安徽省质量工程项目“示范金课”(2022sfjk005)。
针对Web UI页面频繁更新所带来的自动化测试脚本失效问题,在现有基于DOM树的网页元素定位方法基础上,利用新旧版本Web UI页面DOM树的差异和Selenium IDE录制的旧版测试脚本在新版页面上回放所生成的失效XPath路径对原有方法进行改进,提...
关键词:Web UI自动化测试 DOM树 Selenium IDE XPath路径 测试脚本修复 网页元素重定位 
基于DOM树遍历的优质线上教学资源聚类策略研究
《中文科技期刊数据库(全文版)教育科学》2023年第5期190-194,共5页袁赠欢 冯惠 
2021年湖南省教育厅科学研究项目,项目编号21C1225。
随着信息技术的飞速发展,互联网已在不知不觉中深刻影响着教育领域,网页中蕴藏着丰富的信息成为新的教学资源。为了有效地获取网页中的信息,Web信息提取技术应运而生,它提取位于非结构化或半结构化页面中的信息并进行存储。然而,面对当...
关键词:DOM树遍历 DOM 优质 教学资源 聚类 策略 
基于DOM树和混合文本密度的网页信息提取方法研究
《信息与电脑》2023年第10期52-54,共3页魏建兵 
甘肃省高校大学生就业创业能力提升工程项目“电子信息类专业‘赛创、思创、专创、产教’四元融合多元对接就业平台构建与实践”(项目编号:GS-2023-56)。
在网页信息提取领域,文档对象模型(Document Object Model,DOM)树和混合文本密度是两个重要的概念。文章提出一种基于DOM树和混合文本密度的网页信息提取方法。首先,利用DOM树结构分析网页的标签层次结构,确定每个标签的重要性;其次,根...
关键词:DOM树 混合文本密度 信息提取 
基于多特征融合的网页表格数据提取方法
《工业控制计算机》2022年第11期81-83,86,共4页马佳芸 杨林峰 
上海市科委重点项目(19DZ1205802)资助。
随着工业互联网的快速发展,工业管理网站获得大量应用,网页内容防篡改成为重要的安全问题。在面向工业管理网站的篡改检测问题中,网页表格数据检测是其中的重要环节,实现网页表格数据的自动化提取成为研究人员关注的重点问题。现有的网...
关键词:表格数据提取 多特征融合 DOM树 节点聚类 
恶意PDF检测中的特征工程研究与改进被引量:1
《电子科技大学学报》2022年第5期766-773,共8页黄娜 何泾沙 吴亚飈 
北京市博士后科研工作经费支助项目(A创新研发类(2021-ZZ-087))。
在基于机器学习的恶意PDF检测中,现有特征容易引起混淆或逃逸。为了提高特征的准确性和鲁棒性,在现有方法的基础上研究和改进特征提取方法,结合内容特征、结构特征以及逻辑树的间接结构特征,通过分析特征重要性进行特征选择,最后应用分...
关键词:内容特征 DOM树 梯度提升决策树 恶意PDF检测 结构特征 
融合DOM树结构向量的行为类别标签预测模型被引量:2
《计算机仿真》2022年第9期257-262,281,共7页王宝亮 陈伟宁 潘文采 
赛尔网络下一代互联网技术创新项目(NGII20170108)。
针对传统的校园网络行为日志分析仅考虑文本内容而忽视结构信息的问题,提出了融合压缩DOM树结构向量的行为类别标签预测模型。模型通过融合网页文本特征向量和DOM树结构向量并使用分类器进行分类,对于网页文本特征向量,利用TF-IDF方法,...
关键词:用户画像 标签预测 日志分析 
基于DOM树与模板的自适应网络信息抽取方法被引量:2
《计算机应用与软件》2022年第8期15-20,81,共7页柏志安 廖健 曾剑平 
针对论坛型网站的特性,包括标签的重复出现和文本内容的特定模式等,提出一种基于DOM树与模板的自适应信息抽取算法。以拥有共同父节点的邻近结构的相似子树为基础,提出生成候选集以及候选集过滤细分的抽取规则生成方法。该算法能很好地...
关键词:信息抽取 自适应 DOM树 模板 
网页信息抽取方法综述被引量:2
《网络安全技术与应用》2022年第3期12-13,共2页王立志 
随着互联网的快速发展,网络中的信息正在爆炸式地增长,网页作为网络中信息表达的方式之一,其结构也变得越来越复杂。而如何精确、高效地从网页中获取目标信息成为一个问题。本文总结现有的针对网页的信息抽取方法并加以分类,同时分析其...
关键词:信息抽取 WEB网页 DOM树 
检索报告 对象比较 聚类工具 使用帮助 返回顶部