检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海师范大学人文与传播学院,上海200234 [2]广西大学计算机与电子信息学院,广西南宁530000
出 处:《计算机仿真》2016年第4期399-402,446,共5页Computer Simulation
基 金:广西科学研究与技术开发计划项目(1140008-3B);广西自然科学基金项目(2014GXNSFBA118274)
摘 要:针对网络文本进行准确分类是数据处理的基础步骤。由于网络文本数据中所含相似数据量大,数据之间存在特征类似性关联。传统的分类方法针对文本数据的性质,采用增加约束的方式进行特征分类,使得不可分类数据之间也存在着特征相似性关联,需要多次确认,导致分类效果差。提出基于文本最短路径的网络文本分类方法。建立网络文本分类的有向图,计算出每个结点之间的路径值,每个路径值与一个路径集合相对应,用来描述一个网络文本的分类结果;将网络文本的分类问题转化为计算最短路径的问题,利用删除无用结点,并对路径树进行,获得更加准确的分类效果。仿真结果表明,改进算法对网络文本分类准确率高。The paper proposed a method for classifying network text based on the shortest path of text. We established the digraph of network text classification to calculate the path value between every node. Each path value had a corresponding set of path and was used to describe the result of classification. Converting the classification issue to calculation on the shortest path value, we obtained more accurate effect of classifying. To achieve the purpose, we also deleted the useless nodes and updated the shortest path. The simulation results show that the modified algorithm has high classification precision of network texts.
分 类 号:TP365.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229