检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海宝山钢铁股份有限公司,上海201900 [2]华东师范大学商学院信息学系,上海200241
出 处:《现代图书情报技术》2013年第10期73-78,共6页New Technology of Library and Information Service
基 金:上海市科技发展基金软科学研究项目"基于专利文献的本体构建与应用方法研究"(项目编号:13692107000)的研究成果之一
摘 要:介绍从中文专利摘要文本中抽取本体非分类关系的方法。首先对摘要文本的句法格式进行分析,按照"领域句式"、"特征句式"、"组件\工艺句式"和"效果句式"等构建子句抽取规则,再利用B、I、E和O等标注符号对子句中的术语进行人工标注,形成一定规模的训练语料集合,并利用CRFs实现训练语料的学习和新语料的抽取。最后给出应用实例并进行分析,验证方法的有效性。This paper promotes a method which collects the non - taxonomic relation from the Chinese patents' texts. Firstly, it analyzes the syntax of abstract texts, then constructs the sub - sentences extraction rules by domain sentence, character sentence, module & craft sentence and effect sentence. Secondly, artificially labels the terms of sub - sentences by label symbols such as BIEO, creates a scale of training data set. Thirdly, learns the training data and extracts the new data by CRFs. Finally, analyzes the experiment results and verifies the validity of the method.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.127