面向军事领域的土耳其语术语自动抽取研究  

Research on Auto-Extraction of Turkish Terminology in Military Field

在线阅读下载全文

作  者:张贵林 易绵竹 李宏欣[1] 闫丹辉 孙玥莹 ZHANG Guilin;YI Mianzhu;LI Hongxin;YAN Danhui;SUN Yueying

机构地区:[1]战略支援部队信息工程大学洛阳校区,河南洛阳471003 [2]中国科学技术信息研究所,北京100190

出  处:《中国科技术语》2022年第1期26-35,共10页CHINA TERMINOLOGY

基  金:国防科技创新特区项目“面向周边国家多语言信息的领域知识获取与分析”(18H86301ZT00500501)。

摘  要:文章以土耳其语军事领域术语语言特征研究为基础,提出一种规则与统计相结合的术语抽取方法,先后通过关键词、停止词、形态分析序列模式、点互信息、左右信息熵和临接词缀等特征对单语文本中的候选项进行筛选,在W-data和N-data大小两组单语文本中进行实验,结果表明该方法能够有效地从实验数据中抽取土耳其语军事术语。Based on the analysis on the linguistic features of Turkish military terminologies,we proposed a terminology extraction method using combination of rules and statistics algorithm,and experimentally verified this method on monolingual W-data and N-data.The candidate items in the monolingual text are filtered through keywords,stop words,morphological analysis sequence pattern,pointwise mutual information,left and right information entropy and adjacency suffixes.Our results show that the proposed method can effectively extract Turkish military terminologies from the experimental data.

关 键 词:土耳其语军事术语 过滤词典 自动抽取方法 

分 类 号:H512[语言文字] H083

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象