一种自动发现、分割与标注引文元数据的方法  被引量:2

An Approach to Auto-detection,Segmentation and Tagging of Bibliographic Metadata

在线阅读下载全文

作  者:高良才[1] 汤帜[1] 陶欣[1] 房婧[1] 

机构地区:[1]北京大学计算机科学技术研究所,北京100871

出  处:《北京大学学报(自然科学版)》2010年第6期893-900,共8页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:国家科技支撑计划(2006BAH02A21)资助

摘  要:在总结现有的引文元数据抽取方法的基础上,针对引文的排版惯例——引文在文档内部风格一致,提出了一种新的引文元数据抽取方法。重点描述了以往研究中很少涉及的引文元数据的自动发现和分割,探讨了风格一致性在引文元数据标注中的应用。实验结果表明此方法在引文元数据发现、分割和标注方面均取得了较好的效果。After reviewing the existing methods on citation data extraction, the authors propose a new approach for the task depending on a common typesetting practice of bibliographies: style consistency of citation data in the same document. Citation data detection and segmentation task are described on which less attention is put in previous researches. Furthermore, the authors take advantage of the style consistency of bibliographies to enhance citation metadata tagging. Experimental results show that the proposed method performs well in citation data detection, segmentation and tagging.

关 键 词:引文元数据 风格一致性 元数据抽取 数字图书馆 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象