基于浏览器扩展的RPA系统跨域DOM拾取与自动化方案  被引量:3

Cross-domain DOM Pickup and Automation Scheme of RPA System Based on Browser Extension

在线阅读下载全文

作  者:易仁可 蔡宇辉[1] 杨圣洪[1] 吴帆[1] 李肯立[1] YI Renke;CAI Yuhui;YANG Shenghong;WU Fan;LI Kenli(School of Computer Science and Engineering,Hunan University,Changsha 410082,China)

机构地区:[1]湖南大学计算机科学与工程学院,长沙410082

出  处:《计算机科学》2023年第2期237-243,共7页Computer Science

基  金:高性能计算应用软件协同开发工具与环境研究(2017YFB0202201)。

摘  要:机器人流程自动化(Robotic Process Automation,RPA)是当今的研究热点之一,对网页元素的拾取和自动化是RPA的重要功能之一。RPA通过使用浏览器扩展向网页中注入脚本程序以处理网页,使用网页元素定位路径定位到目标节点进行自动化操作,在源网页中存在跨域frame时,由于同源策略的限制,注入源网页的脚本无法获取到目标节点的DOM对象,导致无法生成网页元素定位路径,从而无法自动化。文中提出了一种基于浏览器扩展的RPA系统设计方案,该方案能够对跨域DOM进行拾取和自动化。该方案在处理包含第三方跨域frame的网页时,将其看作与源网页frame地位相等的frame进行处理,网页元素定位路径设计为包含frame的url和网页元素Xpath的形式,以实现跨域网页元素拾取和自动化的功能。实验结果表明,该方案能够有效地对包含跨域资源的网页进行拾取和自动化操作,且同时支持chrome,firefox等支持浏览器扩展的浏览器。Robotic process automation(RPA)is one of today’s research hotspots.The pickup and automation of web page elements is one of the important functions of RPA.RPA injects scripts into the web page to process web pages by using browser extensions,using web page element positioning path to locate to the target node for automated operations.When there is a cross-domain frame in the source web page,due to the limitations of the same-origin strategy,the script injected into the source web page can not obtain the DOM object of the target node,resulting in the inability to generate a web page element positioning path,so that it can not be automated.When processing a web page containing a third-party cross-domain frame,the scheme treats it as a frame process equal to the status of the source web page frame,and the web page element positioning path is designed to contain the url of the frame and the form of the web page element Xpath to achieve cross-domain web page element pickup and automation.Experiments show that the scheme can effectively pick up and automate the elements of cross-domain web pages,and support chrome,firefox,and other browsers that support browser extensions.

关 键 词:浏览器扩展 跨域 RPA 

分 类 号:TP312[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象