王晓斌

作品数:3被引量:20H指数:2
导出分析报告
供职机构:电子工程学院更多>>
发文主题:独立分量分析字词自动抽取中文贝叶斯信息准则更多>>
发文领域:自动化与计算机技术电子电信更多>>
发文期刊:《计算机应用研究》《计算机工程》更多>>
所获基金:博士研究生创新基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
中文领域本体学习中术语的自动抽取被引量:14
《计算机应用研究》2009年第7期2652-2655,共4页温春 王晓斌 石昭祥 
电子工程学院博士研究生创新基金资助项目(2008006)
提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时...
关键词:领域术语抽取 领域主题一致度 领域本体学习 多字词候选术语 字符串分解 
基于独立分量分析的隐蔽Web领域聚类被引量:1
《计算机工程》2009年第7期175-176,179,共3页王晓斌 温春 石昭祥 
针对隐蔽Web主题领域自动识别问题,提出一种基于独立分量分析(ICA)的聚类算法。对查询页面进行页面文本抽取和预处理,利用TF-IDF公式计算权重并选择前N个权重最大的特征词构造文档矩阵,在使用潜在语义索引(LSI)进行特征重构的基础上通过...
关键词:隐蔽Web 潜在语义 独立分量分析 文本聚类 
基于贝叶斯信息准则的文本主题数估计被引量:5
《计算机工程》2009年第7期183-185,共3页王晓斌 温春 石昭祥 
特定领域的主题识别和关键词提取有着广泛的应用,但通过人工指定识别或文本聚类自动生成的主题类别缺乏客观的度量方法。该文结合基于BIC准则的模型选择理论和独立分量分析技术对主题的数量进行概率估计,给出主题数量在BIC意义下的统计...
关键词:主题识别 关键词提取 独立分量分析 贝叶斯信息准则 
检索报告 对象比较 聚类工具 使用帮助 返回顶部