检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王海虹 杨萌 张劲松 谭笑 罗小强 WANG Hai-hong;YANG Meng;ZHANG Jin-song;TAN Xiao;LUO Xiao-qiang(Beijing Institute of Standardization;PipeChina Institute of Science and Technology;Beijing Uban Construction Hua Sheng Traffic Construction Co.,Ltd.)
机构地区:[1]北京市标准化研究院 [2]国家石油天然气管网集团有限公司科学技术研究总院分公司 [3]北京城建华晟交通建设有限公司
出 处:《中国标准化》2024年第16期50-58,共9页China Standardization
摘 要:本研究关注于标准电子文件转换为XML格式的校验方法,目的是确保转换过程中内容的准确性和一致性。涉及455个国家标准、企业标准和行业标准的PDF文件,转换为Word后再编程为机器可读的XML格式。研究应对转换中出现的内容错乱、标签错误等问题,强调校验的重要性。采用IntelliJ IDEA、Notepad++和Acrobat Adobe等工具,在初验、复验和终验三个阶段执行校验。通过建立严格的校验标准和检查表,本研究将XML内容错误率控制在万分之五以下,有效支持标准文件的数字化转型。This paper focuses on the verification method for the conversion of standard electronic documents to XML format,in order to ensure the accuracy and consistency of the content in the conversion process.PDF files involving 455 national standards,enterprise standards and sectoral standards are converted into word format and then programmed into machine readable XML format.The research should deal with the problems such as content disorder and label error in the conversion,and emphasize the importance of verification.IntelliJ IDEA,Notepad++and Acrobat Adobe tools are used to perform the verification in the three stages of preliminary inspection,re-inspection and final inspection.By establishing strict verification standards and checklists,this paper controls the error rate of XML content to less than 5/10000,effectively supporting the digital transformation of standard documents.
关 键 词:标准行业 标准电子文件转换 XML格式校验 机器可读标准
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49