中文专利中本体关系获取研究  被引量:1

Study on Ontology Relation Extraction in Chinese Patent Documents

在线阅读下载全文

作  者:谷俊[1] 许鑫[2] 

机构地区:[1]上海宝山钢铁股份有限公司,上海201900 [2]华东师范大学商学院信息学系,上海200241

出  处:《现代图书情报技术》2013年第10期73-78,共6页New Technology of Library and Information Service

基  金:上海市科技发展基金软科学研究项目"基于专利文献的本体构建与应用方法研究"(项目编号:13692107000)的研究成果之一

摘  要:介绍从中文专利摘要文本中抽取本体非分类关系的方法。首先对摘要文本的句法格式进行分析,按照"领域句式"、"特征句式"、"组件\工艺句式"和"效果句式"等构建子句抽取规则,再利用B、I、E和O等标注符号对子句中的术语进行人工标注,形成一定规模的训练语料集合,并利用CRFs实现训练语料的学习和新语料的抽取。最后给出应用实例并进行分析,验证方法的有效性。This paper promotes a method which collects the non - taxonomic relation from the Chinese patents' texts. Firstly, it analyzes the syntax of abstract texts, then constructs the sub - sentences extraction rules by domain sentence, character sentence, module & craft sentence and effect sentence. Secondly, artificially labels the terms of sub - sentences by label symbols such as BIEO, creates a scale of training data set. Thirdly, learns the training data and extracts the new data by CRFs. Finally, analyzes the experiment results and verifies the validity of the method.

关 键 词:规则匹配 条件随机场 本体学习 非分类关系抽取 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象