网页文本分类

作品数:6被引量:12H指数:2
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:甄杰王邦军仇阿根赵雷王勇更多>>
相关机构:中国测绘科学研究院安徽大学湖南大学阿里巴巴集团控股有限公司更多>>
相关期刊:《科技创业家》《江苏农业科学》《科技通报》《太原科技大学学报》更多>>
相关基金:辽宁省科学事业公益研究基金辽宁省教育厅科学基金国家教育部博士点基金国家自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-6
视图:
排序:
基于NB和CHI值的农业文本分类方法被引量:4
《江苏农业科学》2018年第17期219-223,共5页周云成 许童羽 邓寒冰 
辽宁省科学事业公益研究基金(编号:2016004001);辽宁省教育厅科学研究一股项目(编号:L2014272)
对采集自网络的农业文本进行自动化分类是进一步利用的前提。拟提出1种结合朴素贝叶斯(naive Bayes,简称NB)和χ2(Chi-square,简称CHI)特征词选取的农业文本分类方法,并用Python语言实现相应的文本分类程序和特征词选择程序。通过从农...
关键词:文本分类 农业文本 朴素贝叶斯 CHI值 特征词选取 标题 网页文本分类 
网页文本分类技术研究
《科技创业家》2013年第9期54-54,共1页郭彦兵 
网页文本分类技术是语言处理领域的研究热点,文章从文本分类中涉及到的几个关键技术,按文本分类流程顺序进行了阐述,包括文本分类定义,文本表示模型,文本预处理、文本特征选择、文本分类器选择。
关键词:文本分类 特征提取 K-最近邻法 
结合改进非负矩阵分解的模糊网页文本分类算法
《重庆大学学报(自然科学版)》2013年第8期156-162,共7页贾兆红 李龙澍 朱建建 
国家自然科学基金资助项目(71171184);安徽省自然科学基金资助项目(090412054);教育部高等学校博士学科点专项科研基金资助项目(200803580024);安徽大学青年科学研究基金项目(3305044);人才科研启动项目(2303224)
通过构建向量空间模型可以获得表征网页数据的词文本权重矩阵,然而直接基于此高维矩阵进行分类学习效率较低,为此提出一种结合改进非负矩阵分解的模糊网页文本分类算法。首先,通过迭代的归一化压缩非负矩阵分解将高维的原数据映射到低...
关键词:分类 非负矩阵分解 模糊逻辑 隶属函数 
基于混合智能算法的网页文本分类仿真研究被引量:5
《科技通报》2012年第6期152-154,共3页李建军 宋志章 
齐齐哈尔大学青年教师科学技术类科研启动支持计划项目(2011k-ZX01)
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文...
关键词:网页文本 智能算法 分类方法 文本特征 
基于潜在语义分析的网页文本分类研究被引量:2
《应用能源技术》2009年第11期41-44,共4页王剑锋 乔冬 麻丽娜 李新叶 
华北电力大学青年教师科研基金项目(200811036)
传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验...
关键词:潜在语义分析 网页文本分类 支持向量机 
网页文本分类中的特征选择研究被引量:1
《太原科技大学学报》2007年第4期279-281,共3页庞宁 杨尔弘 
由于超链接语言结构本身所提供的信息,网页分类问题不同于一般的文本分类。本文分析了网页内部特征,并在1000篇网页规模语料库的基础上,通过试验对比了三种特征选择方法对高维特征向量空间进行降维的效果。文章还提出了一种新方法,根据...
关键词:网页分类 特征选择 权重计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部