基于分类标注语料库的关键词标引知识自动获取  被引量:6

Knowledge Repository Acquire for Keywords Auto-Indexing System Based on Labeled and Classed Corpus

在线阅读下载全文

作  者:刘华[1] 

机构地区:[1]暨南大学华文学院,广州510610

出  处:《图书情报工作》2007年第7期41-43,共3页Library and Information Service

摘  要:基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。From a classed large-scale corpus, extracts keywords labeled on web pages by indexing specialist and formed a keywords list; Referring to the two characteristics of keywords: fields non-even and exists range edge, brought up and calculated the words' subject degree by statistical model. Subject degree expresses text content' s subject concept. Based on subject degree, constructed a key words auto-indexing system.

关 键 词:关键词标引 分类语料库 主题度 

分 类 号:G254.2[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象