学术文本的结构功能识别——在学术搜索中的应用  被引量:14

The Structure Function Recognition of Academic Text——Application in Academic Search

在线阅读下载全文

作  者:黄永[1] 陆伟[1] 程齐凯[1] 桂思思[1] 

机构地区:[1]武汉大学信息管理学院信息检索与知识挖掘研究所,武汉430072

出  处:《情报学报》2016年第4期425-431,共7页Journal of the China Society for Scientific and Technical Information

基  金:国家自然科学基金面上项目"面向词汇功能的学术文本语义识别与知识图谱构建"(项目编号:71473183);武汉大学与中国科技信息研究所合作项目"科学文献的语义功能识别与深度利用"研究成果之一

摘  要:在学术大数据环境下,学术文本挖掘研究向细粒度和语义化方向发展。学术文本的结构功能是对学术文本正文的结构及章节功能的概括。为探讨结构功能在学术搜索中的作用,本文将学术文本看作是个结构功能域的集合,使用域加权语言模型对学术文本结构功能进行加权,并以一般语言模型为基准,在INEX04数据上进行了文档级检索实验。实验结果表明本文所提出的模型取得了较大的提升,尤其在P@5上的相对提升达到13.93%。根据模型中各个结构功能域的权重参数分析可以得知,引言功能作用最大,相关研究、方法的作用次之,实验及结论的作用最小。本文的实验也证明了学术文本的结构功能在学术搜索中的应用价值。In scholar big data environment, academic text mining is becoming more fine-grained and semantic. The structure funetion is the summary of the aeademic's 'strueture and function of seetions. From the main content respeet, we use a field-weighted language model based on structure function, and conduct document level retrieval experiments on the datasets of INEX04. The results of experiments demonstrate that our model is more effective than the baseline model and a 13.93% relative improvement has gotten on the P@ 5. The parameters of fields in model show that the introduction is the most important function, and the related work, method follows, the experiment and conclusion are at last. The experiment of this paper also demonstrate the application value of structure function in academic search.

关 键 词:结构功能 学术搜索 域加权 语言模型 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象