检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《科学技术与工程》2009年第16期4653-4656,共4页Science Technology and Engineering
基 金:北京市属高等学校人才强教计划项目(PHR200906210);北京教育委员会科研基地建设项目;北京市教育委员会科技计划项目(KM200810037001);国家自然科学基金重点项目(10673017)资助
摘 要:为了提高中文网页自动分类的分类精度,将SVM-KNN方法用于中文网页分类。提出了一种中文网页的表示方法,在将下载的网页全部表示为向量空间的向量后,用SVM构造了一个多类分类器。在分类时通过在特征空间计算网页所表示的向量和分界面的距离决定采用SVM方法还是KNN方法对其分类。实验证明该方法是一种有效的方法,对网页分类的各类,使用该方法均比使用SVM方法具有更高的分类精度,同时能缓解SVM训练时对核参数的选择困难问题。The SVM-KNN method is applied to Chinese web page classification in order to improve the classify accuracy of Chinese Web page. After analyzing the characteristics of web pages, a new vector representation of web pages was proposed and applies to web page classification. A multi-class classifier is constructed using SVM after the downloaded web pages was presented as a vector of vector space. In the classify phase, the distance is computed from vector to hyper-plane, based on which the SVM and KNN method are chosen. Experiment result shows the SVM-KNN method is valid method, which has a higher classify racy than that of the SVM. Besides, the problem of choosing kernel function parameters SVM is solved using this method.
分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15