不同标引策略下的文本主题表达质量比较研究  被引量:3

Comparative Study of Subject Presentation with Different Indexing Strategies

在线阅读下载全文

作  者:何琳[1] 常颖聪[1] 

机构地区:[1]南京农业大学信息科技学院

出  处:《图书馆杂志》2014年第5期29-33,共5页Library Journal

基  金:江苏省社科基金(12TQC014);江苏省"青蓝工程"资助的部分研究成果

摘  要:标引词的选择直接影响期刊文献检索的查全率与查准率,不同的标引源由于所承载文本内容的不同,其所确定的标引词又有所不同。本文分别选取不同权重下的全文、摘要、首尾段和关键句群作为标引源,采用自动抽词标引算法进行主题表达能力测评,通过设置不同的测评指标从不同角度对标引结果进行比较分析,重点讨论不同的标引策略、标引源的权重分配、文本长度、抽词词典规模等多种因素对主题表达质量的影响。通过定量比较,本文发现待标引语料与标引策略之间存在一定的相关关系,对全文文本进行二次加工、加强语义支持工具的建设仍然是提高主题标引质量的有效措施。The selection of indexing words directly affects retrieval results and their precision. As different indexing sources have different text content, the indexing words determined by different sources will be dissimilar. This paper chose respectively different weights of the full text, , starting and ending paragrphs, and key sentences as indexing sources, used automatic indexing algorithm to extract keywords indexing, and then discussed the relation between indexing result and influence factors, such as indexing strategies, weighting of different indexing source, text length and keyword dictionary. The comparative study revealed that re-processing of full-text could improve the indexing quality, while enhanced semantic tool remains another way to improve the result of subject indexing.

关 键 词:文本标引 标引质量 标引策略 质量比较 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象