结合引文信息的生物医学文本聚类研究  被引量:3

ON BIO-MEDICAL DOCUMENT CLUSTERING WITH CITATION INFORMATION INCORPORATED

在线阅读下载全文

作  者:顾钧[1] 郑晓东[1] 张连明[1] 

机构地区:[1]复旦大学计算机科学技术学院上海智能信息处理重点实验室,上海200433

出  处:《计算机应用与软件》2012年第10期5-7,共3页Computer Applications and Software

基  金:国家自然科学基金项目(60903076)

摘  要:近年来,生物医学文献数量激增,导致严重的信息过载。生物医学文献挖掘能够有效地缓解这一现象,而文献聚类是其中一个重要研究方向。当前文献聚类算法主要是基于文献内容信息实现的,并没有考虑文献间存在的大量引文信息。将引文信息引入到文献聚类中,提出一种结合引文信息和内容信息的聚类算法,实验结果表明了该方法的有效性。Surge in the number of bio-medical documents in recent years leads to information overload. Mining the bio-medical document can finely relieve this problem, and the document clustering is one of the most important research directions in this regard. Current clustering methods are mainly implemented based on the information of document content without considering the volume of citations among documents. In this paper, the citation information is introduced into document clustering. A novel clustering method that incorporates both content and citation information is proposed. Experimental results show the effectiveness of the method.

关 键 词:文献聚类 引文信息 生物文本挖掘 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象