一种高校招生录取数据清洗方法与系统实现  

A Data Cleaning Method and System Implementation for College Enrollment and Admission

在线阅读下载全文

作  者:高晓东 季荣军 GAO Xiao-dong;JI Rong-jun(Security Office,Jiangsu College of Engineering and Technology,Nantong 226006,China;Department of Software Development,Jiangsu Hengpeng Smart City Technology Co.,Ltd.,Nantong 226001,China)

机构地区:[1]江苏工程职业技术学院安全保卫处,江苏南通226006 [2]江苏恒鹏智慧城市技术有限公司软件开发部,江苏南通226001

出  处:《南通职业大学学报》2024年第1期70-76,共7页Journal of Nantong Vocational University

摘  要:全国普通高校招生网上录取子系统提供了以DBF数据格式的数据下载功能,随着高考制度的改革,不同省份不同批次的招生录取数据结构存在较大差异,对高校后期录取数据的清洗和应用带来一定挑战。为解决招生录取异构数据的标准化问题,对录取数据结构差异进行分析,通过自定义数据解析规则实现数据抽取和清洗,以灵活应对数据结构变化,并在不修改管理系统代码的前提下,完成系统开发和实现。实践表明,系统能够对异构数据完成自动解析并生成学生档案三联表,提高了高校招生录取数据管理工作效率,可为建立权威、统一的数据中心提供数据基础。To standardize data structure of college enrollment and admission in different provinces and batches,the differences in admission data structures are analyzed,and data extraction and cleaning are achieved through custom data analysis rules.To deal with the changes of data structures effectively,the system is developed and implemented without modifying the code of management system.Practice shows that the system can analyze different-structured data and generate triplicate forms of student files,which improves the efficiency of college enrollment and admission data management and provides the basic data for the establishment of an authoritative and unified data center.

关 键 词:高校招生 录取数据 数据清洗 ETL 

分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论] G647.32[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象