吉翔华

作品数:3被引量:20H指数:2
导出分析报告
供职机构:中国科学技术大学更多>>
发文主题:文本聚类词性分析关键词科技文摘决策树更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《计算机工程与应用》《小型微型计算机系统》《Journal of Southeast University(English Edition)》更多>>
所获基金:国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于主题子空间的文本模糊C均值聚类方法被引量:2
《小型微型计算机系统》2007年第12期2225-2228,共4页吉翔华 陈超 邵正荣 俞能海 
国家自然科学基金项目(60672056)资助;微软亚洲研究院基金项目(06120809)资助
模糊C均值聚类作为聚类的一种有效方法在数据挖掘和信息检索等领域得到广泛的应用,初始中心和初始隶属度矩阵的建立是决定模糊C均值聚类效果的关键.本文提出一种基于文本主题空间的模糊C均值聚类算法TS2FCM(Topic Sub-Space based Fuzzy...
关键词:TS2FCM 主题子空间 模糊C均值聚类 文本聚类 
Fuzzy c-means text clustering based on topic concept sub-space被引量:3
《Journal of Southeast University(English Edition)》2007年第3期439-442,共4页吉翔华 陈超 邵正荣 俞能海 
The National Natural Science Foundation of China(No60672056);Open Fund of MOE-MS Key Laboratory of Multime-dia Computing and Communication(No06120809)
To improve the accuracy of text clustering, fuzzy c-means clustering based on topic concept sub-space (TCS2FCM) is introduced for classifying texts. Five evaluation functions are combined to extract key phrases. Con...
关键词:TCS2FCM topic concept space fuzzy c-means clustering text clustering 
基于机器学习的科技文摘关键词自动提取方法被引量:15
《计算机工程与应用》2007年第14期170-172,共3页刘佳宾 陈超 邵正荣 吉翔华 
国家自然科学基金(No.60672056);微软基金资助项目(No.2006120809)~~
提出了一种基于机器学习的关键词自动抽取技术,主要是针对数字图书馆中的学术论文的摘要(Abstract)进行抽取。首次提出了以句子为基本抽取单位进行关键词抽取的思想。在提出关键词的候选词时采用n_grams方法和词性相结合的方法,在选取...
关键词:信息自动抽取 决策树 词性分析 n_grams方法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部