用于计算机辅助文献标引加工系统的自然语言词表构建  被引量:6

Construction of Natural Language Thesauri for Automatic Assistant Indexing Literature System

在线阅读下载全文

作  者:杨贺[1,2] 杨奕虹[1,2] 乔晓东[1] 李宁[2] 朱礼军[1] 

机构地区:[1]中国科学技术信息研究所,北京100038 [2]北京万方数据股份有限公司,北京100038

出  处:《现代图书情报技术》2010年第6期17-24,共8页New Technology of Library and Information Service

基  金:"十一五"国家科技支撑计划重点项目<知识组织系统的集成及服务体系研究与实现>子课题"基于集成词表的数据标引加工系统升级改造"(项目编号:2006BAH03B03-02)的研究成果之一

摘  要:讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。The paper mainly discusses the construction of natural language thesauri for automatic assistant indexing literature system. Based on years of massive manual indexing keywords, it analyzes the rules of word frequency, length, type, cooccurrence, and proposes a method for constructing a thesauri of automatic assistant indexing and post controlled vocabulary.

关 键 词:计算机辅助标引 文献加工 机标词表 关键词 字面相似度算法 

分 类 号:G254[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象