机读目录数据管道设计与实现  

Design and Implementation of Machine-readable Cataloging Data Pipeline

在线阅读下载全文

作  者:张伟 ZHANG Wei(National Library of China,Beijing 100081)

机构地区:[1]国家图书馆,北京100081

出  处:《软件》2023年第5期91-94,117,共5页Software

摘  要:机读目录数据是广泛应用于图书情报领域的一种半结构化数据。由于缺乏专用的数据转换工具,机读目录数据预处理往往繁琐且耗时。机读目录数据管道是一套自动化流程,用于将机读目录记录转换为便于数据分析师、数据科学家、应用程序等下游用户使用的JSON数据。从简单的数据报告到复杂的数据科学项目,这种灵活务实的解决方案能够不同程度地简化和优化数据准备工作。MARC(MAchine-readable Cataloging)data is a type of semi-structured data widely used in the field of library and information science.MARC data preprocessing is often tedious and time-consuming because of a lack of dedicated data transformation tools.MARC data pipeline is a series of automated processes that can transform MARC records into JSON data useful for downstream consumers,such as data analysts,data scientists,applications.From simple data reporting to complex data science projects,this flexible and pragmatic solution can simplify and optimize data preparation to varying degrees.

关 键 词:机读目录 数据管道 JSON 

分 类 号:TP311.561[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象