基于领域知识的专利自动分类  被引量:17

A Patent Classification Method Based on Domain Knowledge

在线阅读下载全文

作  者:郭炜强[1] 戴天[1] 文贵华[1] 

机构地区:[1]华南理工大学计算机研究所,广州510641

出  处:《计算机工程》2005年第23期52-54,共3页Computer Engineering

基  金:国家自然科学基金资助项目(60003019)

摘  要:根据改进的词语权重计算方法构造给定文本的特征向量,并用之从专利分类的领域知识――国际分类表IPC中直接提取类别的概念向量和待分类专利文本的特征向量,然后采用向量空间模型实现专利的自动分类,该方法不需要大量的训练样本,具有较高的分类正确率和执行速度。This paper improves the classical approach for calculating the term weight in text, and then employs it to construct the concept vector of the class directly from the domain knowledge of the international patent classification (IPC) and the feature vector of the patent text to be classified. Subsequently vector space model is utilized to classify the given patent text. The experiment and practical systems indicate that the approach is of high classification precision and efficiency.

关 键 词:专利分类 向量空间模型 领域知识 

分 类 号:TP301.1[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象