面向信息检索系统的语义资源规划  被引量:12

A Programme of Semantic Resources Oriented to Information Retrieval

在线阅读下载全文

作  者:袁毓林[1] 

机构地区:[1]北京大学中文系

出  处:《语言科学》2008年第1期1-11,共11页Linguistic Sciences

基  金:国家社会科学基金项目《面向内容计算的汉语语义角色知识库的研究和建设》(项目号:07AYY004)的资助

摘  要:文章通过分析问题回答等信息检索系统对于语义资源的需求,借鉴国外语义资源建设的实践和经验,指出面向处理汉语的信息检索系统的语义资源,至少应该包括下列三种:1)汉语词网(CWN),提供基本的词汇概念及其关系信息;2)汉语谓词网(CVN),提供谓词的论元角色及其句法配置信息;3)汉语命题库(CPB),提供谓词的论元结构在真实文本中如何实现为命题结构的信息。还根据英语WordNet、VerbNet和Prop-Bank的建设和应用情况,结合作者近年来学习语义学理论、研究和建设语义资源的实践和体会,分别说明这三种语义资源的设计目标、内容规模、体系结构和具体的建造策略与步骤等具体问题。Basing on the analyses of the information retrieval system's requirement of the semantic resource and drawing on the experience of the constructions of semantic resource abroad, this paper proposes that the semantic resource oriented to information retrieval must consist of following three modules: 1) Chinese Word Net (CWN), which provides basic knowledge of lexical conceptions and their relations of Chinese words; 2) Chinese Verb Net (CVB), which provides the thematic roles and their syntactic arrangement of Chinese predicates; 3) Chinese Proposition Bank (CPB), which provides the knowledge that how a predicate's argument structure is realized as a proposition in real text. Then, according to the construction and application of the English WordNet, VerbNet and PropBank, and the author's experience of studying semantic theories and constructing Chinese semantic resources, it illustrates the above three resource's design goal, knowledge content, size, architecture and construction strategy and procedure.

关 键 词:信息检索 语义资源 汉语词网 汉语谓词网 汉语命题库 

分 类 号:G354[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象