检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]宁波工程学院电子与信息工程学院,浙江宁波315016 [2]攀枝花学院电气信息与工程学院,四川攀枝花617000
出 处:《计算机工程与科学》2008年第8期61-64,共4页Computer Engineering & Science
摘 要:本文针对基于关联规则的文本过滤器设计做了如下探索:(1)针对中文网络语言的特点,引入n-Gram方法提取文本的特征;(2)提出边界样本的概念;(3)在设计基于关联规则的文本过滤器时,引进了否定选择算法,采用否定选择算法对过滤器的检测器集合进行自体耐受,最终建立高准确率的文本过滤器。实验表明,经过自体耐受的过滤器可以有效地提高过滤准确率。As for the text filter design based on association rules, the paper makes the following efforts: (1)As for the charateristics of the Chinese web language, we introduce the n-Gram method to extract text features; (2)We propose the concept of edge sample; (3)When designing the text filters based on association rules, we introduce a negative-selection algorithm to make the filters' detector set tolerant, and finally build a high-precision text filter. Experiments show that the filters after proper toleration can effectively increase the precision of filtering.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229