医学文献集合的主题抽取和主题聚类实践  被引量:4

A Method for Topic Extraction and Clustering Based on Medical Literature

在线阅读下载全文

作  者:殷蜀梅[1] 张智雄[2] 

机构地区:[1]北京大学医学图书馆,北京100083 [2]中国科学院国家科学图书馆,北京100190

出  处:《数字图书馆论坛》2008年第9期32-36,共5页Digital Library Forum

基  金:本文受国家社会科学基金项目'从数字信息资源中买现知识抽取的理论和方法研究'(05BTQ006)和国家'十一五'科技支撑计划课置'网络科技信息监测与评价'(2006BAH03B05)的资金资助

摘  要:文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题'知识抽取'的文章之一.Important keywords in academic papers reflect topics of the literature. Therefore, the extraction of topics turns to be the extraction of keyword groups. This paper first investigates techniques for topic extraction and clustering used by overseas, then the researchers propose a technical scheme for extracting topics in text information resources in the medical field and for topic area identification. A detailed explanation of the techniques for topic clustering is given. To verify the validity of the method, this paper applies the scheme to the field of osteoarthritis research. The result proves the validity of the proposed method.

关 键 词:知识抽取 主题抽取 BM25F MMTx 文本挖掘 医学数据挖掘 数字图书馆 

分 类 号:G2[文化科学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象