WEB文本分类

作品数:58被引量:165H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:柯慧燕王娟桂海霞饶文碧王卫玲更多>>
相关机构:北京理工大学武汉理工大学山东师范大学南昌大学更多>>
相关期刊:《计算机技术与发展》《计算机工程与设计》《计算机与数字工程》《山东师范大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金山西省高等学校科技创新项目吉林省科技发展计划基金教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于朴素贝叶斯的Web文本分类及其应用被引量:4
《电脑知识与技术》2016年第10X期220-221,230,共3页包小兵 
池州学院院级自然项目(2014ZR005)
Web文本分类在网络信息过滤、信息推荐等方面有广泛的应用。介绍了Web文本分类的基本理论与方法,结合贝叶斯分类算法,对文本分类语料库的数据进行具体的分类实验并进行分析讨论,取得了一定的效果。
关键词:数据挖掘 朴素贝叶斯 文本分类 
基于SAS的web文本分类模型研究
《山东师范大学学报(自然科学版)》2016年第2期11-17,共7页向来生 孙威 刘希玉 
国家自然科学基金资助项目(61170038;61472231);教育部人文社会科学项目(12YJA630152);山东省社会科学基金资助项目(11GGLJ22)
通过建立模型对电商企业的客户查询信息进行文本分类分析,帮助企业掌握用户的消费习惯,同时帮助用户及时找到需要的商品.本文首先获取客户查询数据并对该文本数据进行预处理,利用改进的TF-IDF方法获得文本特征向量,最后结合朴素贝叶斯...
关键词:SAS 文本分类 改进TF—IDF 朴素贝叶斯文本分类 EM迭代 
Web文本分类中的标签权重自动优化研究被引量:4
《小型微型计算机系统》2016年第5期890-894,共5页钟旭东 黄章进 顾乃杰 张旭 
安徽省自然科学基金项目(1408085MKL06)资助;高等学校学科创新引智计划项目(B07033)资助
Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充分利用样本集的结构特性,识别效果提升并不明显.针对这一问题...
关键词:WEB文本分类 自动权重调优 差分进化算法 半结构特征 
基于互信息的不平衡Web文本分类方法研究被引量:1
《情报科学》2015年第10期23-26,共4页刘忠宝 赵文娟 
山西省高等学校科技创新项目(2014142);全国教育信息技术研究十二五规划课题(146241697);"山西省哲学社会科学"十二五"规划2014年度课题
当前主流的Web文本分类方法无法有效解决不平衡文本分类问题。本文在经典C4.5决策树算法基础上,借鉴信息论最新研究成果,提出基于互信息的不平衡Web文本分类方法。该方法与代价信息无关,在深入分析互信息与C4.5决策树之间关系的基础上,...
关键词:互信息 不平衡Web文本 决策树 代价缺失学习 
基于模糊加权近似支持向量机的Web文本分类被引量:2
《计算机应用与软件》2015年第5期54-58,共5页王平 吴剑 
江西省科技支撑计划项目(2009BGB01900);江西省自然科学基金项目(2009JX02367)
Web文本分类是数据挖掘领域的研究热点。针对Web文本数据集高维和不平衡的特点,将模糊隶属度和平衡因子引入近似支持向量机,提出模糊加权近似支持向量机。首先计算样本的平均密度,并结合样本数量求得平衡因子,克服传统加权算法仅以样本...
关键词:文本分类 近似支持向量机 模糊隶属度 平衡因子 不平衡数据 
基于Hadoop的Web文本分类系统设计研究被引量:1
《兰州大学学报(自然科学版)》2014年第6期892-896,共5页赵文娟 
国家自然科学基金项目(61202311);山西省高等学校科技创新项目(2014142);全国教育信息技术研究十二五规划课题项目(146241697)
针对传统Web文本分类方法无法解决大规模分类问题,在深入分析当前主流并行计算平台Hadoop的基础上,提出基于Hadoop的Web文本分类系统,该系统主要包括文本预处理、向量表示、文本分类、结果评价等模块.真实数据集上的比较实验表明所建系...
关键词:WEB文本分类 HADOOP HDFS MAPREDUCE 
基于优化的多核学习方法的Web文本分类的研究
《计算机技术与发展》2013年第10期80-82,86,共4页江伟 潘昊 
湖北省自然科学基金(2011CDB257)
Web文本分类技术是数据挖掘中一个重要研究领域,为了能从海量信息中快速检索遍布网络各处的文档,需要提高Web文本分类技术的性能。多核学习方法是当前机器学习领域的一个热点,可以显著提升分类识别能力和学习推广能力,而核方法是解决高...
关键词:支持向量机 数据挖掘 多核学习 WEB文本分类 
Web文本分类中的反作弊研究
《网友世界》2013年第18期7-7,共1页付敬鼎 张建勇 贾晓强 
渭南师范学院大学生创新基金项目(项目编号:12XK050)
根据用户定义的某一主题,在爬虫算法中加入反作弊思想后,用爬虫算法遍历网络,收集与主题相关的页面进行智能分析,同时将文本过滤转化为文本分类,为了增强通用性,在算法中加入了松弛变量,最后在NB分类个器上验证算法的性能。试验...
关键词:主题爬虫 文本分类 反作弊 松弛变量 
基于概念的Web文本分类方法及实现
《北京信息科技大学学报(自然科学版)》2013年第2期77-81,共5页郑瑞娟 张仰森 
国家自然科学基金资助项目(61070119);北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1005);北京市属市管高等学校人才强教计划基金资助项目(PHR201007131);北京市教委专项基金(PXM2012-014224-000020)
通过研究html网页结构,实现对Web网页中纯文本内容的提取。通过对传统的特征提取方法和文本分类方法进行研究,提出基于概念词典的概念特征提取方法,通过特征提取使用简单向量模糊距离匹配算法对文本进行分类,设计并实现了一个基于中文...
关键词:WEB文本分类 概念特征 概念词典 模糊距离匹配算法 
朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析被引量:8
《成都大学学报(自然科学版)》2013年第1期50-53,共4页詹毅 
为分析对比朴素贝叶斯算法和SVM算法在Web文本分类中的效率及其适用的范围,构建了一个Web分类系统,此分类系统将已分类的Web网页作为训练集,利用分类算法构建Web分类器,通过Web测试集评价两类算法在Web文本分类中的性能体现,为Web文本...
关键词:Web分类系统 朴素贝叶斯算法 SVM算法 效率分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部