基于奇异值分解的专利术语层次关系解析研究  被引量:6

Study on Chinese Patent Terms Hierarchy Parse Based on Singular Value Decomposition

在线阅读下载全文

作  者:吴志祥[1,2] 王昊[1,2] 王雪颖[1,2] 祁磊[3] 苏新宁[1,2] 

机构地区:[1]南京大学信息管理学院,南京210023 [2]南京大学江苏省数据工程与知识服务重点实验室,南京210023 [3]南京大学计算机软件新技术国家重点实验室,南京210023

出  处:《情报学报》2017年第5期473-483,共11页Journal of the China Society for Scientific and Technical Information

基  金:江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(BK20130587);江苏省"333"工程项目"面向知识服务的中文本体学习研究"(BRA2015401);国家社科重大招标项目"面向突发事件应急决策的快速响应情报体系研究"(13&ZD174)

摘  要:奇异值分解是矩阵分析中常用的分解技术,在高维数据的降维、去噪方面有着广泛的应用。本文将矩阵的奇异值分解技术应用到领域专利术语的层次关系解析中,其核心思想是术语语义空间的深度转换,旨在用某种潜在特征代替文档作为属性来表示术语。具体研究包括,基于位置加权的原始术语-文档语义空间的构建方法、基于奇异值分解的术语特征抽取方法、基于术语-特征语义空间的术语层次关系解析方法。本文对论述的理论方法进行了实证研究,证实了该方法的可行性和有效性,并在此基础上实现较大规模的钢铁冶金领域专利术语层次关系解析,将解析结果纳入到本体学习理论体系中,实现该领域专利术语的知识本体化与可视化。Singular value decomposition (SVD) is a commonly used decomposition technique in matrix analysis. It has been widely used in the dimension reduction and denoising of high-dimensional data. In this paper, the matrix SVD technique is applied to the hierarchy parse of domain patent terminology. The core idea is the depth transforma- tion of term semantic space, which aims to express the term with a certain latent feature, instead of document, as an attribute. Specific research includes the construction of original term-document semantic space (TPSS), based on lo- cation weighting; term feature extraction, based on SVD; and hierarchy parse, based on term-feature semantic space (TFSS). The feasibility and validity of the proposed theoretical methods are verified by empirical study in this paper. On this basis, the hierarchical relationship of the patent terms in iron and steel metallurgy (I&SM) is parsed, and the result is incorporated into the ontology learning theory system, realizing the ontological and visualization of the patent knowledge in I&SM.

关 键 词:术语语义空间转换 矩阵奇异值分解 术语特征抽取 术语层次关系 本体学习 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象