基于SVR模型的中文领域术语自动抽取研究——面向图书情报领域  被引量:6

Research on Chinese Automatic Terminology Extraction Based on SVR Model

在线阅读下载全文

作  者:蒋婷[1] 孙建军[1] 

机构地区:[1]南京大学信息管理学院,江苏南京210093

出  处:《情报理论与实践》2016年第1期24-31,15,共9页Information Studies:Theory & Application

基  金:国家社会科学基金重大招标项目"面向学科领域的网络信息资源深度聚合与服务研究"的成果;项目编号:12&ZD221

摘  要:[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。[ Purpose/significance ] Terminology is one of the most important parts of ontology. Automatic terminology extraction is the basis of automatic ontology construction. This paper adopts the method of regression to predict the probability of unknown words ( a value or combined values corresponds to the set of candidate words in terms of probability) . [ Method/process] The pa- per focuses on the combination of linguistics and statistical methods to extract the candidates based on rule-based method. By using the method of regression, the paper takes the terminology extraction problem as the prediction issue of terminology probability. [ Result/conclusion ] The experiment verifies the validation of the proposed method.

关 键 词:支持向量回归机 本体构建 本体学习 术语抽取 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象