巧用Clementine简化数据处理  

Simplifying data processing by making use of Clementine in a clever way

在线阅读下载全文

作  者:郑慧霞[1] 

机构地区:[1]中国协和医科大学图书馆网络技术服务部,北京100005

出  处:《中华医学图书情报杂志》2011年第4期59-62,共4页Chinese Journal of Medical Library and Information Science

基  金:中国医学科学院医学信息研究所基本科研业务费支持项目:基于Web挖掘的读者行为分析(编号R0830)

摘  要:用著名的数据挖掘工具Clementine处理数据有些大材小用,但它的确比Excel更易用、更高效,处理数据时不需要翻看复杂的编程手册、在Excel表中拉滚动条、选择各种函数等。以国家科技文献中心(NSTL)签到数据上传处理为研究实例,涉及数据查重、规范、筛选、映射、比对、频次统计等各种常见任务,介绍了如何根据不同处理需求定制相应Clementine数据流和Clementine工具在海量数据处理中的优势。It is to put a large material to a small use when Clementine, a well-known data mining tool is used to process da. However, it is easier to use with a higher efficacy in processing data than Excel because it does not need to read the complex programming manual, to pull the scroll bar in Excel, and to select the different functions. How to build the corresponding data flow according to the requirements of different data processing and bring Clementine into full play was described by taking the uploading of registered attendance data in National Science and Technology Literature Center as an example, including duplicate data check, data standardization, data screening, data mapping, comparison and frequency.

关 键 词:CLEMENTINE 数据处理 映射 比对 

分 类 号:G254.362[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象