HotDataSpider,一个生物医学文献热点数据自动化抽取工具  被引量:1

HotDataSpider,An ETL Tool for Supplementary-Data Extraction of Biomedical Journals

在线阅读下载全文

作  者:许庆炜[1,2] 郭坚[1,3] 

机构地区:[1]湖北第二师范学院计算机科学与工程系,武汉430205 [2]中国科学院上海生命科学研究院系统生物学重点实验室生物信息中心,上海200031 [3]华中科技大学中英HUST-RRes作物基因工程和基因组学联合实验室,武汉430074

出  处:《计算机与数字工程》2010年第11期69-71,85,共4页Computer & Digital Engineering

基  金:国家科技支撑计划课题(编号2008BAI64B01)资助

摘  要:学术期刊中的附加数据是进行数据分析和文本挖掘的重要依据,具有的分散性、多样性和时效性的特点,难以管理和维护,文章将这类数据称HotData。HotDataSpider以生物医学类文献为研究对象,对生物信息学领域15本国际权威期刊提供的附加数据进行分析,实现了自动抽取、转换,最终将整理好的数据集批量导入到上海生物信息技术研究中心提供的HotData主题数据库中。Journal's supplementary-data play an important role in data analysis and text mining,which need to be kept in public repositories.This kind of supplementary material will be named HotData.In this paper,we developed HotDataSpider which investigated how to extract,annotate and load these HotData from the 15 international authoritative biomedical journals.

关 键 词:HotData ETL 生物医学 附加数据 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象