基于DOM和VBA的Word文档数据交互式抽取  被引量:11

INTERACTIVE EXTRACTION OF SEMI-STRUCTURED DATA IN WORD BASED ON DOM AND VBA

在线阅读下载全文

作  者:孙晓伟[1] 毕晓清[1] 吴洪越[1] 赵卫东[1] 

机构地区:[1]山东科技大学信息科学与工程学院,山东青岛266510

出  处:《计算机应用与软件》2013年第2期113-115,共3页Computer Applications and Software

基  金:国家高技术研究发展计划项目(2009AA062704)

摘  要:针对信息系统Word文档中的数据提取问题,分析现有解决方案中存在的不足,提出交互式提取Word文档中半结构化数据的方法。该方法通过制定Word模板、编写宏函数并运用可交互的外部程序调用宏函数,将Word文档中指定的内容提取到数据库中。实现了Word文档中半结构化数据提取的方便性和灵活性。Aiming at data extraction problems of Word document in information systems,in this paper we analyse the deficiencies of existing solutions,and propose an interactive extraction method of semi-structured data.This method extracts the specified contents in a Word document into database through the development of Word template,writing macro functions,and running an interactive external program to invoke the macro functions.The method makes it convenient and flexible to extract the semi-structured data in Word document to the database.

关 键 词:WORD文档 数据抽取 数据库 半结构化数据 交互式 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象