检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]复旦大学计算机科学技术学院上海智能信息处理重点实验室,上海200433
出 处:《计算机应用与软件》2012年第10期5-7,共3页Computer Applications and Software
基 金:国家自然科学基金项目(60903076)
摘 要:近年来,生物医学文献数量激增,导致严重的信息过载。生物医学文献挖掘能够有效地缓解这一现象,而文献聚类是其中一个重要研究方向。当前文献聚类算法主要是基于文献内容信息实现的,并没有考虑文献间存在的大量引文信息。将引文信息引入到文献聚类中,提出一种结合引文信息和内容信息的聚类算法,实验结果表明了该方法的有效性。Surge in the number of bio-medical documents in recent years leads to information overload. Mining the bio-medical document can finely relieve this problem, and the document clustering is one of the most important research directions in this regard. Current clustering methods are mainly implemented based on the information of document content without considering the volume of citations among documents. In this paper, the citation information is introduced into document clustering. A novel clustering method that incorporates both content and citation information is proposed. Experimental results show the effectiveness of the method.
分 类 号:TP302[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30