检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]空军驻深圳地区军事代表室,深圳518026 [2]南京航空航天大学信息科学与技术学院,南京210016
出 处:《计算机与数字工程》2010年第2期90-93,共4页Computer & Digital Engineering
摘 要:提出一种以词性为参考值的文本挖掘算法,能有效挖掘与种子词有关的关联规则。基于Bootstrapping算法思想,既减少了预处理阶段对于词根还原的依赖,能处理日志中出现的中文词汇。增加了对于日志文本上下的理解,提高了关联规则的有效性,并应用与IDS日志挖掘之中,有效改善挖掘效率,为规则库提供关联规则。We made a text mining algorithm using part of speech (POS) as its argument, which can effectively mine the seed-related rules. Based on the idea of Bootstrapping algorithm, it can reduce the dependence of root-restoring on the pre- processing stage, process Chinese vocabulary appear in the log, increase the understanding of context, enhance the effectiveness of rule-relating. When applied in IDS log mining, it will significantly improve the mining efficiency and provide rule li- brary with rules.
关 键 词:词性 ICTCLAS BOOTSTRAPPING 入侵检测系统 数据挖掘
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40