基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验  被引量:18

Automatic Indexing Based on Multi-vocabularies

在线阅读下载全文

作  者:查贵庭[1] 侯汉清[1] 

机构地区:[1]南京农业大学信息管理系,南京210095

出  处:《情报学报》2002年第3期273-277,共5页Journal of the China Society for Scientific and Technical Information

基  金:国家社科基金资助 ;课题编号 :98BTQ0 0 7

摘  要:避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。The paper proposed a technique of automatic word-extracting based on multiple vocabularties so as to avoid the technical difficulties of word-segmenting in Chinese.These vocabularies are as follows:stop-list,synonymous list,keyword list,thesaurus,concordance of keyword string VS class number,etc.,their function,construction and application are detailed.The paper introduces and evaluates the automatic indexing system of economic news of Xinhua News Agency.

关 键 词:新闻标引 自动标引 自动分类 词表技术 自然语言标引 词表构建 自动抽词 中文信息处理 

分 类 号:G254.3[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象