检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安徽大学计算智能与信号处理重点实验室,安徽合肥230039
出 处:《计算机技术与发展》2007年第6期113-115,共3页Computer Technology and Development
基 金:"九七三"计划国家重点基础研究(2004CB318108);国家自然科学基金(60475017;60135010);安徽省自然科学基金(050420208)
摘 要:分类是文本信息搜索和挖掘的核心内容,被广泛应用于搜索引擎的设计以及数据挖掘的研究中。首先对文本进行分词,对分词的结果采用x2统计量的方法提取特征,再使用前向神经网络的交叉覆盖算法作为分类器进行文本分类。实验表明,x2统计量可大规模降低特征维数,在此基础上结合交叉覆盖算法的优秀分类能力,可在特征维数较低的情况下获得一个性能较好的文本分类器。Text classification is the key point in text information searching and mining and is widely used in the design of search engine and data mining. Use the method of x^2 statistic to extract text's characteristics after processing the text and then use cross cover algorithm to design a classifier. The result of experiment shows that the method of x^2 statistic can decrease the dimensions effectively and the cross cover algorithm has good classification ability that can achieve a satisfactory classifier.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3