基于本体的数字图书馆检索模型研究(Ⅱ)——语义信息的提取  被引量:18

Research on the Ontology-based Retrieval Model of Digital Library (Ⅱ)——Semantic Information Acquisition

在线阅读下载全文

作  者:董慧[1] 余传明[1] 姜赢[1] 杨宁[1] 徐国虎[1] 张华[1] 

机构地区:[1]武汉大学信息资源研究中心,武汉430072

出  处:《情报学报》2006年第4期451-461,共11页Journal of the China Society for Scientific and Technical Information

基  金:本文属国家自然科学基金资助项目(批准号:70373047)成果之一.

摘  要:语义信息提取是一项较新的技术,本文讨论语义信息提取的定义、原理和思路,并以国共两党关系历史为领域背景,详细分析语义信息提取的过程,即对于待处理的自然语言文字,将其进行分段和分句;针对拆分出的句子,进行分词和词性标注;在词性标注的基础上选择适当动词作为句子的语义谓词;判断该谓词是否属于语义谓词列表;再根据语义谓词来获取相关的语义实体,同时对于指示代词进行消解;最后对时间和地点维进行提取,并更新语义提取背景.本文还对开发过程中所用到的数据结构、关键算法进行了分析.Semantic information acquisition is an emerging technology. In this text, the author realized the GGHZ semantic information acquisition component with the steps below : splitting the paragraph into sentence, word tokenization and Part-of Speech tagging, selecting the semantic predict, selecting the semantic subject based on the semantic predict, selecting the semantic object based on the semantic predict, pronoun resolution, time correction and location correction and at last updating the semantic extraction context. The author provided the technical details in realizing the semantic information acquisition.

关 键 词:语义信息提取 本体 

分 类 号:G2[文化科学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象