中文网页分类

作品数:26被引量:192H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:冯是聪李晓明吴扬扬刘艳民段昕更多>>
相关机构:北京大学清华大学安徽大学华侨大学更多>>
相关期刊:《微电子学与计算机》《福建电脑》《电脑开发与应用》《电脑知识与技术》更多>>
相关基金:国家重点基础研究发展计划国家自然科学基金福建省科技计划项目中国矿业大学青年科技基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于极限学习机的网页分类应用被引量:1
《计算机工程与应用》2015年第5期102-106,共5页陈先福 李石君 曾慧 
国家自然科学基金(No.61272109)
极限学习机ELM不同于传统的神经网络学习算法(如BP算法),是一种高效的单隐层前馈神经网络(SLFNs)学习算法。将极限学习机引入到中文网页分类任务中。对中文网页进行预处理,提取其特性信息,从而形成网页特征树,产生定长编码作为极限学习...
关键词:极限学习机 中文网页分类 神经网络 网页特征提取 
中文网页分类技术解析
《福建电脑》2015年第2期73-74,共2页郑津 景彦昊 
本文从网页分类方面对万维网上的数据处理技术进行了分析,对中文网页/文本分类技术进行了介绍,阐述了基于支持向量机的网页自动分类算法。
关键词:文本信息 网页分类 向量机 
基于CFS-GA特征选择算法的中文网页自动分类被引量:2
《上海海事大学学报》2012年第1期77-81,共5页喻春萍 黄晓霞 
国家自然科学基金(61175044)
为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色...
关键词:中文网页分类 特征选择 基于关联的特征选择算法 遗传算法 
基于KNN及相关链接的中文网页分类研究被引量:2
《哈尔滨商业大学学报(自然科学版)》2011年第2期203-207,共5页金一宁 王华兵 王德峰 
哈尔滨商业大学青年骨干教师科研创新项目(SD06030)
提出了中文网页相关链接提取算法,能够较好地抽取出中文网页中的相关链接,算法的时间复杂性低,准确率和召回率都令人满意.基于向量空间模型,采用KNN对中文网页进行分类,比较了基于网页标题分类、基于网页正文分类,以及将正文与相关链接...
关键词:中文网页分类 网页提取 相关链接 KNN 
基于KNC算法的中文网页分类方法研究
《河南大学学报(自然科学版)》2010年第5期529-532,共4页李旻 杜海顺 王琪 
针对中文网页分类问题,提出一种基于KM和CV的KNN改进算法——KNC算法.基于该方法的网页分类实验结果表明,KNC算法在保持分类质量的情况下,较大地提高了分类的速度.
关键词:网页分类 KNC KNN 
一种基于预分类的高效SVM中文网页分类器被引量:19
《计算机工程与应用》2010年第1期125-128,共4页许世明 武波 马翠 邸思 徐洪奎 杜如虚 
中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重...
关键词:支持向量机 中文网页分类 文本分类 机器学习 
中文网页分类方法的研究被引量:3
《微电子学与计算机》2009年第9期166-169,共4页刘艳民 
实现了一个中文网页采集、过滤和分类系统.文中从网页预处理、特征选择、分类器模型等方面介绍了该系统的具体解决方案.实验结果表明,该分类系统取得了令人满意的分类效果.
关键词:中文网页 网页分类 特征选取 分类算法 
快速的中文网页分类方法实现被引量:1
《山西电子技术》2008年第4期7-9,共3页朱志宁 黄青松 
云南省条件平台项目(No.2006PT06);昆明理工大学校青(2007-60)
详细介绍了一种快速的中文网页分类系统的设计与实现,通过解析出网页的主要内容、网页的Title、网页的Meta标签内容和指向该网页的父网页上的锚文本,并根据这些信息用VSM法将网页分类。实验结果表明,本文的方法可以使中文网页分类性能...
关键词:页面解析 文本分类 网页分类 VSM分类器 
组合降维技术在中文网页分类中的应用被引量:3
《计算机工程与应用》2007年第24期169-171,共3页李新福 
河北省自然科学基金(the Natural Science Foundation of Hebei Province;Grant No.F2006001020);河北省教育厅科学基金(the Founda-tion of Education Bureau of Hebei Province;Grant No.2005347);河北大学科学基金(the Fundation of Hebei University;Grant No.Y2004045)
基于向量空间模型的文本分类中特征向量是极度稀疏的高维向量,只有降低向量空间维数才能提高分类效率。在利用统计方法选择文本分类特征降低特征空间维数的基础上,采用隐含语义分析技术,挖掘文档特征间的语义信息,利用矩阵奇异值分解理...
关键词:网页分类隐含语义分析特征选择KNN 
基于体裁的中文网页分类的特征选取被引量:4
《计算机工程与设计》2007年第11期2743-2745,共3页黄臻臻 吴扬扬 
福建省科技计划基金项目(20041014);福建省自然科学基金项目(A0510020)。
探讨基于体裁的中文网页分类的特征项选取问题。词汇特征方面,结合自动抽取和人工归纳的方式来获得.通过改进PAT树存储结构,进行序列挖掘来获得频繁字符串特征,使得文本分类系统摆脱对切词处理和词典的依赖,并提出了模糊字符串模式的...
关键词:网页分类 体裁 特征选取 序列挖掘 模糊字符串模式 
检索报告 对象比较 聚类工具 使用帮助 返回顶部