检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]智能技术与系统国家重点实验室,清华大学计算机系北京100084
出 处:《中文信息学报》2002年第6期1-8,共8页Journal of Chinese Information Processing
基 金:国家自然科学基金项目 (6 990 30 0 7) ;国家 973基金项目 (G19980 30 5 0 7) ;国家 86 3计划项目 (2 0 0 1AA114 0 4 0 )
摘 要:本文应用基于实例的MBL(Memory BasedLearning)学习方法 ,对汉语中较常见的 9种基本短语的边界及类别进行识别 ,并利用短语内部构成结构和词汇信息对预测中出现的边界歧义和短语类型歧义进行了排歧处理。实验中还比较了在特征向量中加入词汇信息与否对实验结果的影响。实验取得了比较令人满意的结果 :对这 9种基本短语的识别正确率达到 95 .2 % ;召回率达到 93.7%。This paper proposed a hybrid model to identify Chinese base phrases.At first step,We use a memory based learning (MBL) approach to the chunking of nine types of Chinese base phrases and compare the results coming from different feature vectors.In the second series of experiments we used grammar rules that represent the inner structures of base phrases and lexical information to correct the incorrect predictions from the first step.The experiments reported in this paper show competitive results:the precision is 95.2% and the recall is 93.7%.
关 键 词:部分分析 基本短语 实例学习 短语结构 词汇排放 短语识别 自然语言处理 汉语句法分析
分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.188