检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李大伟[1] 熊华平[2] 石广仁[1] 牛敏[1]
机构地区:[1]中国石油勘探开发研究院,北京100083 [2]大庆油田有限责任公司勘探开发研究院,黑龙江大庆163712
出 处:《大庆石油地质与开发》2016年第1期66-70,共5页Petroleum Geology & Oilfield Development in Daqing
基 金:国家油气重大科技专项"全球剩余油气资源研究及油气资产快速评价技术"(2011ZX050)
摘 要:石油工业早已进入大数据时代,数据挖掘是充分利用数据资产价值的有效途径,而数据预处理是数据挖掘研究的热点之一。分析了数据挖掘以及数据预处理的意义及其现状,提出了在石油工业进行数据挖掘的基本思路;以某国际石油勘探开发技术服务与咨询公司研制的全球典型油气田数据库为例,以"采收率"为挖掘对象,详细解析了各种常用的数据挖掘预处理方法和具体做法,主要包括数据获取、属性选择、数据清理、数据集成、数据变换、数据规约和数据消密;提出了源数据的"5C"标准,即Correctness(正确性)、Currency(适时性)、Completeness(完整性)、Consistency(一致性)、Confidentiality(保密性)。研究成果可为石油行业开展数据预处理等工作提供参考。Oil industry has entered upon "big data" epoch for many years, the data tapping or mining is an effec- tive method to fully utilize the value of the data asset, and the data preprocessing is one of the study focuses of the data mining. The significance and situation of the data mining and preprocessing are analyzed, the basic thinking of the data mining in oil industry was presented. Taking Global Typical Oil and Gas Field database from an interna- tional petroleum exploration and development service and consultant company as the example, the detailed methods of the data mining preprocessing are dissected by taking "recovery factor" as the mining object. These methods in- clude: data acquisition, attribute selection, data cleaning, data integration, data conversion, data specification and data confidentiality treatment; finally "5C" criteria for the source data are proposed: correctness, currency, com- pleteness, consistency and confidentiality. These achievements can provide references for the researchers on the da- ta preprocessing and so on in oil industry.
分 类 号:TE19[石油与天然气工程—油气勘探]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.218.161.96