检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李军锋[1] 吕学强[1] 李卓[1] 徐丽萍[2]
机构地区:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 [2]北京城市系统工程研究中心,北京100089
出 处:《小型微型计算机系统》2015年第4期721-726,共6页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(61271304)资助;北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)资助
摘 要:专利领域的同义词表是提升专利检索性能的重要资源,当前国内此类资源相对稀缺,亟需寻找一种高效的同义词自动识别方法.该文提出一种用于专利领域同义词识别的类决策树模型.分析专利搜索日志中候选同义词构词规律、外来词音译规律、汉语语义词序规律,提出词形特征、语音特征、语义特征.分析特征间的关联特性以及样本数据的分布规律,构建用于出专利领域同义词识别的类决策树模型.实验结果表明,在多个测试样本中,平均F-值达到0.914,取得了较好的识别效果.The synonym table is a necessary resource for enhancing the performance of a patent search engine. It is urgent to find an ef- ficient automatic recognition method for synonyms in patent domain. This paper presents a Likely Decision Tree model for the recogni- tion of synonyms in patent domain. By analyzing the formation rules of candidates,the translation rules of exotics and the word order rules of Chinese semantics, literal feature, pronunciation feature and sematic feature are presented. A Likely Decision Tree model is presented to, by analyzing the association between those features and the distribution of the sample data. The experimental result shows that this method can achieve better recognition results with an average F-value of 0.914 in test samples.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.200