靖红芳

作品数:3被引量:39H指数:3
导出分析报告
供职机构:中国科学院计算技术研究所更多>>
发文主题:文本分类数据挖掘VSM计算机应用中文信息处理更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《哈尔滨工业大学学报》《中文信息学报》《计算机研究与发展》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划北京市自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
中文网页搜索日志中的特殊命名实体挖掘被引量:5
《哈尔滨工业大学学报》2011年第5期119-122,共4页张磊 王斌 靖红芳 吴丽辉 
国家自然科学基金资助项目(60603094);国家重点基础研究发展计划(973)资助项目(2007CB311103);国家高技术研究发展计划(863)资助项目(2006AA010105);北京市自然科学基金资助项目(4082030)
利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方...
关键词:特殊命名实体 数据挖掘 信息检索 网页搜索日志 
文本分类中特征权重因子的作用研究被引量:16
《中文信息学报》2010年第3期97-104,共8页张爱华 靖红芳 王斌 徐燕 
国家自然科学基金资助项目(60873166);国家973资助项目(2007CB311103);国家863计划资助项目(2006AA010105)
在传统的基于向量空间的文本分类中,特征权重计算与特征选择过程完全割裂,特征选择函数的得分能反映特征的重要性,却未被纳入权重表示,造成特征表示不精确并影响分类性能。一些改进方法使用特征选择函数等修改TFIDF模型,提高了分类性能...
关键词:计算机应用 中文信息处理 文本分类 权重表示 权重因子作用 VSM 
基于类别分布的特征选择框架被引量:18
《计算机研究与发展》2009年第9期1586-1593,共8页靖红芳 王斌 杨雅辉 徐燕 
国家"九七三"重点基础研究发展计划基金项目(2007CB311103);国家自然科学基金项目(60873166;60603094);国家"八六三"高技术研究发展计划基金项目(2006AA010105)~~
目前已有很多种特征选择方法,但就目前所知,没有一种方法能够在非平衡语料上取得很好的效果.依据特征在类别间的分布特点提出了基于类别分布的特征选择框架.该框架能够利用特征的分布信息选出具有较强区分能力的特征,同时允许给类别灵...
关键词:特征选择 非平衡语料 特征降维 文本分类 数据挖掘 
检索报告 对象比较 聚类工具 使用帮助 返回顶部