检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘海峰[1] 刘守生[1] 宋阿羚 LIU Haifeng;LIU Shousheng;SONG Aling(Institute of Sciences, PLA University of Science and Technology, Nanjing 210007, China)
出 处:《计算机工程与应用》2017年第4期113-117,122,共6页Computer Engineering and Applications
基 金:国家自然科学基金(No.61273209);江苏省自然科学基金(No.BK2012511)
摘 要:文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改进,提出了一种基于词频分布信息的优化IG特征选择方法。随后的文本分类实验验证了提出的优化IG模型的有效性。Text feature selection is the core technology of text classification. Based on the deficiency of information gain model, the IG model has been improved step by step according to the feature items distribution within the class and between the classes. A kind of optimazation of IG feature selection method based on word frequency division information is presented.The text categorization test verifies the effectiveness of the proposed optimization IG model.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.81