中文叙词表本体概念定义注释的自动构建研究  被引量:2

Research on Automatic Construction of Definition Notes for Concepts in OntoThesaurus

在线阅读下载全文

作  者:田金凤[1] 曾新红[1,2] 黄华军[2] 林伟明[2] 

机构地区:[1]深圳大学计算机与软件学院,深圳518060 [2]深圳大学图书馆,深圳518060

出  处:《现代图书情报技术》2011年第11期9-16,共8页New Technology of Library and Information Service

基  金:广东省哲学社会科学"十一五"规划项目"中文知识组织系统的形式化语义描述标准体系研究"(编号GD10CTS02);广东省自然科学基金团队项目"新型计算模式及其软件开发方法研究"(编号:10351806001000000)的研究成果之一

摘  要:设计面向综合性中文叙词表本体的叙词概念定义抽取方法,获得良好的实验效果并已投入实际应用。其中,基于"高频词与句子向量"和"TF*IDF向量"两种定义抽取算法提出的二维相对量的融合算法,能够更有效地抽取出前两种方法的良好结果,有效信息提高比一般可达到60%。The paper proposes some methods of definition extraction for concepts in the comprehensive OntoThesaurus. They achieve good experiment effects and are applied to the actual OTCSS. Among them, an integrated algorithm named "two - dimensional relative quantity" based on "high - frequency words vector" and "TF * IDF vector" is presented. This algorithm can much effectively extract good results from that of the first two methods, and the effective information impro- ving ratio can reach 60% generally.

关 键 词:中文叙词表本体 OTCSS 定义抽取 向量空间模型 高频词与句子向量TF*IDF向量 二维相对量 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象