标准大数据实践(2)——内容深度挖掘被引量：2

Standard Big Data Practice —— Deep Mining of Content(Part B)

出　　处：《标准科学》2016年第2期35-39,101,共6页Standard Science

基　　金：中央基本科研业务费支撑项目"基于文本相似度计算的标准查新工具研究"(项目编号:252015Y-4003)资助

摘　　要：大数据时代,人们面对的问题不再是缺少数据,而是被数据淹没了,即所谓"人们淹没于数据,却饥饿于知识"[1]。面对这样的状况,仅靠传统的检索工具已经远远不能满足人们的需要。本文研究了标准文献内容挖掘的关键技术:OCR、正则提取、反向索引,以及标准文献碎片挖掘与检索的系统实现的业务流程、技术框架以及实现效果。In the era of big data, what people face is the overwhelming data instead of lacking of data, which is called ＂people drowned out by the data, but hunger for knowledge＂ [1]. Faced with such situation, people＇s needs can＇t be satisfied only by the traditional retrieval tool. This paper studies the key technologies of the literature mining of standards literature, including OCR, regular extraction, inverted index, as well as system implementation of business process, technology framework and implementation effect of literature mining and retrieval of standard pieces.

关键词：文本挖掘标准碎片化

分类号：F203[经济管理—国民经济]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

标准大数据实践(2)——内容深度挖掘被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

标准大数据实践(2)——内容深度挖掘 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

标准大数据实践(2)——内容深度挖掘被引量：2