检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]信息工程大学电子技术学院404教研室,郑州450004
出 处:《计算机工程与应用》2008年第28期226-229,共4页Computer Engineering and Applications
基 金:金盾工程项目。
摘 要:依据公安情报文本中不同位置的词条对区分文本类别的贡献显著不同的特点,引入位置权重系数,改进了经典的文本特征权重计算方法(TF-IDF),使文本的权重能够更加全面地反映文本的类别信息。根据公安情报分类系统的需求,设计了基于支持向量机(SVM)的公安情报分类系统,该系统不仅能够实现情报文本的自动分类,而且能够保留在情报文本分类的不同阶段语料的特征信息,为情报信息的进一步加工处理提供支持,同时系统中各模块间采用松耦合的方式衔接,提高了系统的适应性和灵活性。通过实验验证了系统设计的合理性和有效性。In the public security information text,the vocabulary entries in different positions own obviously different ability to distinguish the text categorization.According to the features of the public security information text,this paper introduces the regional weight modulus,improves the classic TF-IDF.It makes the weight of vocabulary entry can full-scale express the contributions on the text's category.This paper designs the automatic text categorization system of public security information based on Support Vector Machine (SVM),according to the requirements of public security information.This system not only distinguishes the text classification automatically,but also retrains the features information at different stages of the categorization process.It will support the further information procession.Meanwhile,this system reduces the coupling degree of the subcomponents, provides the flexible system structure ,and improves the adaptability of system.At last,the rationality of the design for this system is verified by experiment.
分 类 号:TP274.3[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145