检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程》2005年第23期52-54,共3页Computer Engineering
基 金:国家自然科学基金资助项目(60003019)
摘 要:根据改进的词语权重计算方法构造给定文本的特征向量,并用之从专利分类的领域知识――国际分类表IPC中直接提取类别的概念向量和待分类专利文本的特征向量,然后采用向量空间模型实现专利的自动分类,该方法不需要大量的训练样本,具有较高的分类正确率和执行速度。This paper improves the classical approach for calculating the term weight in text, and then employs it to construct the concept vector of the class directly from the domain knowledge of the international patent classification (IPC) and the feature vector of the patent text to be classified. Subsequently vector space model is utilized to classify the given patent text. The experiment and practical systems indicate that the approach is of high classification precision and efficiency.
分 类 号:TP301.1[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117

