WEB文本聚类

作品数:11被引量:20H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:许芳芳贾丙静吴长勤贾焰韩伟红更多>>
相关机构:重庆邮电大学扬州大学江南大学华东师范大学更多>>
相关期刊:《计算机工程与应用》《长春师范学院学报(自然科学版)》《计算机应用与软件》《电脑知识与技术》更多>>
相关基金:安徽省高校省级自然科学研究项目国家高技术研究发展计划江苏省自然科学基金国家自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进BBO的Web文本聚类算法
《福建师范大学学报(自然科学版)》2015年第6期18-23,117,共7页李超雄 黄发良 温肖谦 
教育部人文社会科学研究青年基金项目(12YJCZH074);福建省教育厅资助项目(JA13077)
针对生物地理优化算法(Biogeography-Based Optimization,BBO)随机初始化以及轮盘迁移机制等不足,结合自组织神经网络算法(Self-Organizing Map,SOM),提出了一种用于Web文本聚类的改进BBO算法(Improved Biogeography-Based Optimization...
关键词:WEB文本聚类 生物地理优化算法 自组织神经网络 
一种新的Web中文文本聚类方法研究被引量:3
《计算机应用与软件》2013年第12期222-225,287,共5页叶宇飞 安世全 代劲 
传统的文本聚类缺少语义信息,文本的特征向量高维稀疏,忽略了Web文本的特殊性。为了解决这些问题,提出一种Web中文文本聚类方法。在基于知网(HowNet)的概念空间基础上过滤非名词,分析文本中重要词汇的语义,对标签特征集与正文特征集进...
关键词:WEB文本聚类 特征降维 知网 文本相似度 
基于属性重要性的Web文本聚类研究
《重庆文理学院学报(自然科学版)》2011年第3期49-51,共3页贾丙静 王传安 王亚军 吴长勤 
安徽省教育厅自然科学基金项目(KJ2009B121Z);安徽科技学院引进人才基金项目(ZRC2008176)
Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属...
关键词:WEB文本聚类 特征表示 特征选择 属性重要性 
Web文本聚类的研究与实现被引量:2
《长春师范学院学报(自然科学版)》2011年第3期26-29,共4页贾丙静 吴长勤 葛华 
安徽科技学院引进人才基金项目(ZRC2008176);安徽省教育厅自然科学基金项目(KJ2009B121Z)
Web文本聚类是使文本之间具有最大的簇内相似性,同时具有最小的簇间相似性,它是一个将文本集分组的全自动处理过程。本文首先提出了Web文本聚类模型,然后对Web文本聚类关键技术进行了深入的研究,讨论了分词、特征表示、特征选择和K-mean...
关键词:WEB文本聚类 分词 特征表示 特征选择 K-MEANS算法 
Web文本聚类算法的分析比较被引量:2
《计算机时代》2010年第10期6-9,共4页许芳芳 王新伟 
随着计算机网络的发展,各种文本资源以惊人的速度增长,导致信息搜寻困难和信息利用率低下。而快速高质量的Web文本聚类技术可以满足用户方便快捷地从互联网获得所需要的信息资源。文章对Web文本聚类如网页采集、去噪、分词、特征表示等...
关键词:文本挖掘 WEB文本聚类 Web文本预处理 聚类算法 
一种基于主题的Web文本聚类算法被引量:2
《成都大学学报(自然科学版)》2010年第3期249-252,共4页袁晓峰 
设计了一种基于主题的Web文本聚类方法(HTBC):首先根据文本的标题和正文提取文本的主题词向量,然后通过训练文本集生成词聚类,并将每个主题词向量归类到其应属的词类,再将同属于一个词类的主题词向量对应的文本归并到用对应词类的名字...
关键词:HTBC算法 WEB文本聚类 主题 搜索引擎 互信息 
基于概念格的Web文本聚类被引量:3
《计算机工程与应用》2008年第23期169-171,186,共4页李云 田素方 李拓 徐涛 
国家自然科学基金(No.60575035;No.60673060);江苏省自然科学基金(No.BK2004052)~~
Web文本聚类大多是基于空间向量文本表示模型的,它没有考虑特征词之间的语义关系,并且特征词的维数非常高,造成文本语义信息的损失和时间复杂度的增加。把文本作为对象,文本中的特征词作为对应的属性,形成了基于文本的形式背景,从中提...
关键词:WEB文档 聚类 概念格 约简 
一种改进的HL-DBSCAN聚类算法在Web文本挖掘上的应用被引量:1
《计算机时代》2008年第9期67-68,共2页林国平 陈磊松 
漳州师范学院科研基金项目(SK07002)
提出了一种改进的HL-DBSCAN聚类算法,即基于分级的密度聚类算法的改进算法。该算法的时间复杂度较HL-DBSCAN聚类算法小,其适用范围更广,更能体现聚簇的规律,分类精度更高。文章给出了改进的HL-DBSCAN聚类算法的实验结果,证明了改进的HL-...
关键词:分级聚类 WEB文本聚类 HL—DBSCAN 改进算法 
基于频繁词集和k-Means的Web文本聚类混合算法被引量:6
《计算机工程与科学》2008年第8期92-96,119,共6页王乐 田李 贾焰 韩伟红 
国家863计划资助项目(2006AA01Z451;2006AA10Z237)
当前,Web文本聚类主要存在三个挑战:数据规模海量性、高维空间处理复杂性和聚类结果的可理解性。针对上述挑战,本文提出了一个基于top-k频繁词集和k-means的混合聚类算法topHDC。该算法在生成初始聚簇时避免了高维空间向量处理,k个频繁...
关键词:文本挖掘 聚类 频繁词集 K-MEANS 
一种用于Web文本聚类的特征选择方法被引量:2
《计算机应用与软件》2007年第1期154-156,共3页王卫玲 刘培玉 刘克非 
特征选择已经广泛地应用在文本分类和文本聚类中,相对于无监督的特征选择方法,有监督的特征选择方法在过滤噪音等方面更为有效。但是,由于缺少类标签,它很难应用到文本聚类中。提出了一种针对W eb文本聚类的新的特征选择算法———基于k...
关键词:WEB挖掘 聚类 向量空间模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部