基于XML技术的非结构化数据到结构化数据转换的研究  被引量:9

Research on conversion of unstructured data to structured data based on XML technology

在线阅读下载全文

作  者:李爱民[1] 谭献海[1] 

机构地区:[1]西南交通大学信息科学与技术学院,成都610031

出  处:《铁路计算机应用》2012年第10期12-15,18,共5页Railway Computer Application

基  金:国家科技支撑计划项目(2011G14012)

摘  要:针对高速列车数字化仿真平台的数据来源各异,仿真输出文件非结构化,各子系统之间数据交换量大等特点,迫切需要研制一种协同仿真异构数据转换及统一数据交换接口解决方案。本文主要研究协同仿真异构数据转换与管理,提供统一的异构数据交换与访问接口。引入了数据提取的模板概念以及基于X M L技术的数据转换方法,该方法将表数据和表结构分别存放于XML和Schema文件中,再解析XML和Schema文件生成元数据及SQL建表语句完成异构数据的转换。该方法使得非结构化数据到结构化数据转换的流程高效、快捷。Because of the difference for data sources of high-speed train digital simulation platform,unstructured simulation output file,a large of data exchange among subsystem and so on,it was needed urgently to research on a solution of collaborative simulation of heterogeneous data transformation and harmonization of data exchange interface.This article was mainly responsible for the collaborative simulation of heterogeneous data transformation and management,provided unified heterogeneous data exchange and access interface.This paper introduced the concept of template of data extraction as well as an XML-based data conversion method,by this method,the table data and the table structure was stored in XML file and Schema file respectively to parse XML and Schema file,generate metadata and SQL,build the table statement,complete the conversion of heterogeneous data.This approach made the conversion process of unstructured data to structured data fast and efficiently.

关 键 词:非结构化数据 模板 XML SCHEMA 转换 解析 

分 类 号:U292.5[交通运输工程—交通运输规划与管理] TP301[交通运输工程—道路与铁道工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象