检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广西师范大学计算机科学系,广西桂林541004
出 处:《微机发展》2004年第9期33-35,39,共4页Microcomputer Development
摘 要:文本分类是文本挖掘的基础与核心,分类器的构建是文本分类的关键,利用贝叶斯网络可以构造出分类性能较好的分类器。文中利用Matlab构造出了两种分类器:朴素贝叶斯分类器NBC,用互信息测度和条件互信息测度构建了TANC。用UCI上下载的标准数据集验证所构造的分类器,实验结果表明,所建构的几种分类器的性能总体比文献中列的高些,从而表明所建立的分类器的有效性和正确性。笔者对所建构的分类器进行优化并应用于文本分类中。Text classification has been considered as foundation and a hot research in text mining.Constructing classifier plays a key role in text categorization and effective classifier can be constructed using Bayesian network.Naive Bayesian classier and Tree Augmented Naive Bayesian classifier have been constructed using Matlab. TANC was measured using mutual information (MI) and conditional mutual information (CMI).Results of effective performance have been achieved in experiments for standard data sets from UCI.It demonstrats the effectiveness and correctness of these classifiers.These classifiers would be optimized and applied to text categorization.
关 键 词:MATLAB语言 分类器 文本挖掘 文本分类 贝叶斯网络 数据挖掘 朴素贝叶斯分类器 树扩展的朴素贝叶斯分类器
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15