基于开放网络知识的信息检索与数据挖掘  被引量:97

Open Web Knowledge Aided Information Search and Data Mining

在线阅读下载全文

作  者:王元卓[1] 贾岩涛[1] 刘大伟[2,3] 靳小龙[1] 程学旗[1] 

机构地区:[1]中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所),北京100190 [2]烟台中科网络技术研究所 [3]中国科学院计算技术研究所烟台分所,山东烟台264005

出  处:《计算机研究与发展》2015年第2期456-474,共19页Journal of Computer Research and Development

基  金:国家“九七三”重点基础研究发展计划基金项目(2014CB340401,2013CB329601);国家自然科学基金项目(61173008,61100175,61232010,60933005,61402442);北京市科技新星计划项目(Z121101002512063);北京市自然科学基金青年基金项目(4154086)

摘  要:网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望.Network big data refers to the massive data generated via interaction and fusion of the ternary human-machine-thing universe in the cyberspace and available on the Internet. It has a few typical features, such as multi-sourced, heterogeneous, interactive, bursty, and noisy. It contains mainly unstructured data, and has strong real-timeness. Network big data implicitly contains tremendous highly-interconnected knowledge. Building up open Web oriented large-scale knowledge bases is an effective means for obtaining rich knowledge from network big data. This paper compares both the domestic and international mainstream open Web knowledge bases. We specifically analyze the core techniques and methods for constructing open Web knowledge bases, fusing multi-sourced knowledge, and updating the knowledge bases. Furthermore, we summarize the research status and main issues of open Web knowledge base based information search, data mining, and system applications from different aspects, including user intension understanding, query extension, semantic Q~〉.A, clue mining, relationship referencing, and prediction of relationships and attributes. Finally, we look into the development trends and main challenges of open Web knowledge bases.

关 键 词:网络大数据 开放网络知识 本体 信息检索 数据挖掘 

分 类 号:TP182[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象