检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学人文学院计算语言学研究室,北京100084
出 处:《中文信息学报》2003年第2期7-13,共7页Journal of Chinese Information Processing
摘 要:谓语中心词的识别是句法成分分析中的一个非常重要的部分。本文提出了一种规则和特征学习相结合的谓语识别方法 ,将整个谓语识别的过程分为语片捆绑、谓语粗筛选和谓语精筛选三个阶段。在谓语粗筛选中 ,利用规则过滤掉明显不能充当谓语的词 ,得到一个准谓语集 ;在精筛选阶段 ,选择谓语的支持特征 ,根据统计计算得到每个特征对谓语的支持度 ,然后利用准谓语在句子中的上下文出现的特征对准谓语集中的词进行再次筛选 ,从而确定出句子的谓语中心词。经过测试表明 。Recognizing the predicate head is an important part of the syntactic analysis of Chinese sentences.This paper presents a new approach to recognize the predicate head automatically,which combines a rule based method with a multi feature based method.The process of recognizing is broken into three sub process:preprocess,coarse filter and fine filter.We use a rule based method to filter the quasi predicate that may be the predicate of a sentence.In the fine filter,we select and compute a great diversity of features by statistic,then use these features to recognize the real predicate of this sentence.The result of experiments indicates that this approach is feasible and advanced.
关 键 词:计算机应用 中文信息处理 谓语中心词的识别 基于规则 特征选择 粗筛选 精筛选
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7