检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙晓伟[1] 毕晓清[1] 吴洪越[1] 赵卫东[1]
机构地区:[1]山东科技大学信息科学与工程学院,山东青岛266510
出 处:《计算机应用与软件》2013年第2期113-115,共3页Computer Applications and Software
基 金:国家高技术研究发展计划项目(2009AA062704)
摘 要:针对信息系统Word文档中的数据提取问题,分析现有解决方案中存在的不足,提出交互式提取Word文档中半结构化数据的方法。该方法通过制定Word模板、编写宏函数并运用可交互的外部程序调用宏函数,将Word文档中指定的内容提取到数据库中。实现了Word文档中半结构化数据提取的方便性和灵活性。Aiming at data extraction problems of Word document in information systems,in this paper we analyse the deficiencies of existing solutions,and propose an interactive extraction method of semi-structured data.This method extracts the specified contents in a Word document into database through the development of Word template,writing macro functions,and running an interactive external program to invoke the macro functions.The method makes it convenient and flexible to extract the semi-structured data in Word document to the database.
关 键 词:WORD文档 数据抽取 数据库 半结构化数据 交互式
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.12.198.162