检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张伟 ZHANG Wei(National Library of China,Beijing 100081)
机构地区:[1]国家图书馆,北京100081
出 处:《软件》2023年第5期91-94,117,共5页Software
摘 要:机读目录数据是广泛应用于图书情报领域的一种半结构化数据。由于缺乏专用的数据转换工具,机读目录数据预处理往往繁琐且耗时。机读目录数据管道是一套自动化流程,用于将机读目录记录转换为便于数据分析师、数据科学家、应用程序等下游用户使用的JSON数据。从简单的数据报告到复杂的数据科学项目,这种灵活务实的解决方案能够不同程度地简化和优化数据准备工作。MARC(MAchine-readable Cataloging)data is a type of semi-structured data widely used in the field of library and information science.MARC data preprocessing is often tedious and time-consuming because of a lack of dedicated data transformation tools.MARC data pipeline is a series of automated processes that can transform MARC records into JSON data useful for downstream consumers,such as data analysts,data scientists,applications.From simple data reporting to complex data science projects,this flexible and pragmatic solution can simplify and optimize data preparation to varying degrees.
分 类 号:TP311.561[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.63