检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《现代计算机》2009年第9期18-21,共4页Modern Computer
摘 要:设计一个针对网络不良信息的智能信息过滤模型,通过对特征提取常用方法的研究,选择文档频率阈值、x2-统计量和人工提取相结合的方法来进行特征提取,并利用VSM方法来表示文本;同时提出创建主词典和同、近义词两个词典来作为特征词典,既降低向量空间维数,又提高了特征提取的准确率,利用KSOM网络来训练文本分类机。Designs an adaptive webpages information filtering model for the harmful information in the webpages, selects a document frequency (DF), x2-statistic extraction and the combination of manual extraction methods for feature extraction, and expresses the texts by Vector Space Model (VSM). At the same time, proposes to create major dictionary and synonym and near-synonym dictionary as characteristic word dictionary. In this way, it can not only reduce the dimension of vector space, but also increase rate of accuracy in feature extraction, achieves the feature selection of the training texts, and trains a text automatic classification based on KSOM.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222