利用VB读取方正排版文件提取元数据  被引量:8

Research on metadata extraction by using VB to read from founder typesetting files

在线阅读下载全文

作  者:杨海亮[1] 徐用吉[1] 

机构地区:[1]东北大学学报编辑部

出  处:《中国科技期刊研究》2015年第6期612-617,共6页Chinese Journal of Scientific and Technical Periodicals

摘  要:【目的】为科技期刊自动提取更加全面的元数据提供方法和借鉴。【方法】以方正排版文件为对象,建立了提取元数据的数学模型,同时提出尾部分割算法。然后利用基于对象的VB编程软件编写了自动提取元数据程序。【结果】在分析了方正排版语言特点之后,对方正排版文件进行了字符串替换处理,并建立了分割关键词列表文件,最后将提取的元数据保存到Excel文件中。【结论】实际应用表明,仅几秒钟就可以完成一期数据的提取工作,大大提高了工作效率。[Purpose] The objective of this paper is to automatically extract more comprehensive metadata from the journals of science and technology.[Methodology] A mathematical model which takes founder typesetting files as the object is established to extract the metadata,and also the tail segmentation algorithm is advanced.Then,the automatic metadata extraction software is programmed based on VB programming software.[Findings] The strings of founder typesetting files are replaced,with analyzing the founder typesetting language features,and then a segmentation keywords list file is established.Finally,the extracted metadata is saved to the Excel file.[Conclusions] The actual application shows that completing the extraction work of 1 issue consumes only a few seconds,which greatly improves the work efficiency.

关 键 词:网刊发布系统 元数据 方正排版 VB 自动提取 

分 类 号:G230.7[文化科学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象