孙建涛

作品数:7被引量:78H指数:4
导出分析报告
供职机构:清华大学信息科学技术学院智能技术与系统国家重点实验室更多>>
发文主题:文本分类支持向量机网页分类网页极大熵方法更多>>
发文领域:自动化与计算机技术理学更多>>
发文期刊:《系统工程理论与实践》《小型微型计算机系统》《清华大学学报(自然科学版)》《计算机工程与应用》更多>>
所获基金:国家重点基础研究发展计划国家自然科学基金中国博士后科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-7
视图:
排序:
线性支持向量机优化问题的极大熵方法被引量:2
《小型微型计算机系统》2006年第7期1383-1387,共5页郭崇慧 孙建涛 陆玉昌 唐焕文 
国家自然科学基金项目(10571018)资助;国家"九七三"重点基础研究发展项目(1998030414)资助;中国博士后科学基金项目(2003033153)资助
支持向量机是一种新的机器学习方法,已成功地应用于模式分类、回归分析和密度估计等问题中.本文依据统计学习理论和最优化理论建立了线性支持向量机的无约束优化模型,并给出了一种有效的近似解法—极大熵方法,为求解支持向量机优化问题...
关键词:机器学习 支持向量机 极大熵方法 
广义支持向量机优化问题的极大熵方法被引量:11
《系统工程理论与实践》2005年第6期27-32,共6页郭崇慧 孙建涛 陆玉昌 
国家自然科学基金(79990580);973国家重点基础研究发展规划(G1998030414);中国博士后科学基金(2003033153)
 依据最优化理论中的KKT互补条件建立了广义支持向量机的无约束优化模型,并给出了一种有效的光滑化近似解法极大熵方法,为求解支持向量机优化问题提供了一种新途径.该方法特别易于计算机实现,理论分析和数值实验结果表明了模型和算法...
关键词:最优化 支持向量机 极大熵方法 
基于HowNet构造语义场的方法被引量:4
《清华大学学报(自然科学版)》2005年第1期77-80,共4页王大亮 孙建涛 陆玉昌 夏克俭 王泉德 
国家自然科学基金资助项目(79990584);国家"九七三"基础研究基金项目(G1998030414)
为了能尽量消除传统语义场研究中的主观随意性,提出一种基于HowNet构造语义场的新方法,并充分利用语义场的空间特性,将词语相似度计算引入语义场用于划分语义场结构。计算实例表明:提出的构造语义场、划分语义场结构的方法,有利于计算...
关键词:信息处理 语义场 词语相似度 HOWNET 文本挖掘 
文本分类中结合评估函数的TEF-WA权值调整技术被引量:26
《计算机研究与发展》2005年第1期47-53,共7页唐焕玲 孙建涛 陆玉昌 
国家自然科学基金重大项目(79990584)国家"九七三"重点基础研究发展规划基金项目(G1998030414)
文本自动分类面临的难题之一是如何从高维的特征空间中选取对文本分类有效的特征,以适应文本分类算法并提高分类精度.针对这一问题,在分析比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种结合评估函数的TEF-WA权重调整...
关键词:向量空间模型(VSM) 特征选择 权重调整 特征评估函数 文本分类 
一种面向自动文本摘要特征评价的新方法
《计算机工程与应用》2004年第33期176-178,183,共4页王大亮 孙建涛 陆玉昌 夏克俭 
国家自然科学基金重大项目(编号:79990584);国家973基础研究规划项目(编号:G1998030414)资助
自动文本的特征评价方法的研究一直未受到研究者们的重视。以往只是简单地将面向文本集的TF.IDF特征评价方法应用于针对单文本的自动文摘领域,该方法无法排除低频词噪音的影响,特征评价存在明显误差,致使不能准确计算文本特征。文章引...
关键词:自动文摘 文本挖掘 特征评价 信息熵 
多项式核支持向量机文本分类器泛化性能分析被引量:17
《计算机研究与发展》2004年第8期1321-1326,共6页孙建涛 郭崇慧 陆玉昌 石纯一 
国家自然科学基金重大项目 ( 79990 5 80 ) ;国家"九七三"重点基础研究发展规划项目 (G19980 3 0 414 )
VC维理论和结构风险最小化准则是统计学习理论中的重要内容 ,基于这一理论的支持向量机算法由于具有好的泛化性能受到重视 ,并被研究用于文本分类问题 基于多项式核的研究工作认为SVM的泛化能力不受多项式阶数的影响 ,并且能够处理很高...
关键词:支持向量机 文本分类 结构风险最小化 
网页分类技术被引量:18
《清华大学学报(自然科学版)》2004年第1期65-68,共4页孙建涛 沈抖 陆玉昌 石纯一 
国家"九七三"基础研究基金项目(G1998030414)
网页分类是使用机器学习的方法实现网页类别的自动标注。回顾了文本分类技术的研究状况,分析了网页的结构特征,难点在于结合网页的结构信息选择合理的表示方式和分类算法。使用纯文本分类技术处理网页是不合理的。基于概率模型的方法和...
关键词:网页分类 机器学习 文本分类 网络挖掘 
检索报告 对象比较 聚类工具 使用帮助 返回顶部