医学学术信息自动采集系统的设计与实现  

Design and Implementation of Medical Academic Information Automatic Gathering System

在线阅读下载全文

作  者:武海东[1] 何晓阳[1] 张精理[1] 

机构地区:[1]第三军医大学图书馆,重庆400038

出  处:《现代图书情报技术》2014年第11期73-78,共6页New Technology of Library and Information Service

摘  要:【目的】针对高水平期刊文献的中文导读这类特定的新闻信息,构建一套自动汇聚医学网站新闻系统,实现关键词提取、分类及期刊导航等二次数据加工功能。【应用背景】为图书馆开展主动推送及学科服务提供国外学术研究信息源。【方法】利用Http Client与HtmlP arser构建主题网页采集器,实现新闻列表页及内容采集。利用IK Analyzer2012分词器及医学主题词表实现关键词提取及学科分类。【结果】系统实现指定网站新闻的自动采集、关键词提取、学科分类归属等功能。【结论】为图书馆员开展学术信息推送及学科化服务等提供一套行之有效的工具,为医学研究者纵览学术进展提供一站式访问。[Objective] Aiming at Chinese news of medical research literature published on top journals, design an automatic gathering system which can gather news from different medical news websites, extract content and keywords, realize the subject classification and journal navigation. [Context] Provide information source of foreign academic research for active push and subject services. [Methods] Using HttpClient & HtmlParser to build Web-page collector, realize the news list page and content acquisition. Using IK Analyzer 2012 and MeSH to realize medical keywords extraction and subject classification. [Results] The system achieves automatic gathering, keyword extraction and subject classification of specified website news. [Conclusions] Librarians can use this system to provide effective medical academic information push service for medicine researchers.

关 键 词:信息采集 学术期刊 HTTPCLIENT HTMLPARSER 信息推送 

分 类 号:G250.7[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象