WEB文档分类

作品数:9被引量:51H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:陈力罗杰王凯夏德麟李杨更多>>
相关机构:中国科学技术大学武汉大学复旦大学西安交通大学更多>>
相关期刊:《滁州学院学报》《计算机技术与发展》《计算机工程与设计》《计算机工程与应用》更多>>
相关基金:国家自然科学基金广东省自然科学基金山东省自然科学基金山东省优秀中青年科学家科研奖励基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-9
视图:
排序:
Web文档分类中TFIDF特征选择算法的改进被引量:4
《计算机技术与发展》2019年第5期49-53,共5页段国仑 谢钧 郭蕾蕾 王晓莹 
国家自然科学基金(61101202)
随着海量数据资源在网络中的出现,Web文档分类技术越来越受到重视。在Web文档分类的研究中,特征选择算法有着重要的研究意义。特征选择能有效降低文本向量空间模型的维度,从而构造出更快,消耗更低的预测模型。传统的TFIDF算法仅仅依靠...
关键词:WEB文档分类 特征选择 TFIDF算法 SVM 
一种融合多种信息的Web文档分类方法被引量:1
《信息技术与网络安全》2018年第6期76-79,共4页段国仑 谢钧 郭蕾蕾 王晓莹 
当前的Web文档分类方法大多以正文的文本分类为基础,没有很好地利用网页中所蕴含的多种信息。为提高Web文档的分类精度,提出一种融合Web文档中多种信息(如正文、描述信息、关键字、图片相关文本、标题以及文章中加粗等特殊字体)的文本...
关键词:WEB文档分类 信息融合 遗传算法 支持向量机 
负关联规则在Web文档分类中的研究
《信息化纵横》2009年第13期1-3,10,共4页石芙芙 董祥军 陈修宽 
山东省自然科学基金(Y2007G25);山东省优秀中青年科学家奖励基金项目(2006BS01017)
对Web文档进行分类可以较好地解决网上信息杂乱的现象,介绍了Web文档分类的相关知识以及关键技术,并对目前的分类方法进行了总结,对Web文档分类中关联规则挖掘研究现状和主要技术进行了论述,指出了负关联规则在Web文档分类中的发展趋势。
关键词:数据挖掘 Web文档分类技术 负关联规则 
用于WEB文档分类的并行KNN算法被引量:1
《计算机工程与应用》2008年第25期155-156,共2页周朴雄 
广东省自然科学基金No.07300647~~
针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(lo...
关键词:文档分类 K最近邻 并行策略 
Web文档分类方法的比较与分析
《滁州学院学报》2007年第6期33-35,共3页汪志圣 李龙澍 
滁州学院自然科学基金项目(KJ2007B124)
对Web文档进行分类可以较好地解决网上信息杂乱的现象,而且方便用户准确定位所需的信息,有效地提高了信息服务的质量。目前对Web文档进行分类的技术包括基于文档内容的分类方法和基于文档性质的分类方法。本文在对Web文档分类技术进行...
关键词:数据挖掘 WEB文档分类 
基于新的关键词提取方法的快速文本分类系统被引量:17
《计算机应用研究》2006年第4期32-34,共3页罗杰 陈力 夏德麟 王凯 
国家自然科学基金资助项目(90204008)
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以...
关键词:计算机应用 中文信息处理 关键词提取 WEB文档分类 
基于关联规则的Web文档分类被引量:8
《计算机工程与设计》2005年第9期2515-2518,共4页马光志 张生庭 
在现有的Web文档分类器中,有的分类器产生比较精确的分类结果,有的分类器产生更易解释的分类模型,但还没有分类器可以将两个方面的优点结合起来。有鉴于此,论文提出一种基于关联规则的Web文档分类方法。该方法采用事务概念,主要考虑两...
关键词:WEB文档分类 文本分类 关联规则 
基于Rough集潜在语义索引的Web文档分类被引量:7
《计算机工程》2004年第13期3-5,共3页何明 冯博琴 傅向华 
Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约...
关键词:粗糙集 潜在语义索引 WEB文档分类 信息过滤 信息检索 
基于kNN的快速WEB文档分类被引量:13
《小型微型计算机系统》2004年第4期725-729,共5页李杨 曾海泉 刘庆华 胡运发 
国家自然科学基金 ( 60 173 0 2 7)资助
根据测试文档在各个样本类中的分布情况 ,发现了基于 k NN分类的两个有助于减少大量计算的重要性质 ,在此基础上提出了两个重要算法 :排类算法和归类算法 ,从而构建了一个基于 k NN的快速 Web文档分类方法 .理论与实验表明 ,这种方法可...
关键词:文档分类 KNN 快速分类 排类算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部