专利领域同义词识别  

Recognition of Synonyms in Patent Domain

在线阅读下载全文

作  者:李军锋[1] 吕学强[1] 李卓[1] 徐丽萍[2] 

机构地区:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 [2]北京城市系统工程研究中心,北京100089

出  处:《小型微型计算机系统》2015年第4期721-726,共6页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(61271304)资助;北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)资助

摘  要:专利领域的同义词表是提升专利检索性能的重要资源,当前国内此类资源相对稀缺,亟需寻找一种高效的同义词自动识别方法.该文提出一种用于专利领域同义词识别的类决策树模型.分析专利搜索日志中候选同义词构词规律、外来词音译规律、汉语语义词序规律,提出词形特征、语音特征、语义特征.分析特征间的关联特性以及样本数据的分布规律,构建用于出专利领域同义词识别的类决策树模型.实验结果表明,在多个测试样本中,平均F-值达到0.914,取得了较好的识别效果.The synonym table is a necessary resource for enhancing the performance of a patent search engine. It is urgent to find an ef- ficient automatic recognition method for synonyms in patent domain. This paper presents a Likely Decision Tree model for the recogni- tion of synonyms in patent domain. By analyzing the formation rules of candidates,the translation rules of exotics and the word order rules of Chinese semantics, literal feature, pronunciation feature and sematic feature are presented. A Likely Decision Tree model is presented to, by analyzing the association between those features and the distribution of the sample data. The experimental result shows that this method can achieve better recognition results with an average F-value of 0.914 in test samples.

关 键 词:专利 同义词 语义特征 类决策树 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象