中文领域本体学习中术语的自动抽取  被引量:14

Automatic domain-specific term extraction in Chinese domain ontology learning

在线阅读下载全文

作  者:温春[1] 王晓斌[1] 石昭祥[1] 

机构地区:[1]电子工程学院网络工程系,合肥230037

出  处:《计算机应用研究》2009年第7期2652-2655,共4页Application Research of Computers

基  金:电子工程学院博士研究生创新基金资助项目(2008006)

摘  要:提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时间复杂度并提高了领域术语抽取的准确率和召回率。实验表明,术语抽取准确率为90.64%,优于现有的抽取方法。This paper introduced a hybrid strategy to extract domain-specific terms automatically. At the beginning, executed multi-word candidate extraction and Chinese word segmentation at the same time with two threads. Then merged their result sets. Finally extracted the domain-specific terms with domain relevance and domain topic consensus method. In multi-word candidate extraction and domain-specific term extraction periods, it improved the presented methods respectively to decrease time complexity of string decomposing and increase the precision and recall. Experimental results show that the precision of hy- brid method achieves 90.64% , which is better than that of presented Chinese domain-specific term extraction methods.

关 键 词:领域术语抽取 领域主题一致度 领域本体学习 多字词候选术语 字符串分解 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象