检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华中师范大学语言与语言教育研究中心,武汉430079 [2]湖南省第一师范学院信息科学与工程系,长沙410205
出 处:《计算机应用研究》2011年第12期4426-4428,4432,共4页Application Research of Computers
基 金:国家自然科学基金资助项目(60703008);国家重点实验室开放研究基金资助项目(SKLSE04-018);教育部人文社科重点研究基地重大资助项目(10JJD740012);湖北省科技攻关资助项目(2007AA101C49)
摘 要:提出了关联词搭配模式自动发现的基本方法。建立一个大规模语料库,然后作分词处理,并对关联词进行自动标注和人工校对;评估关联词搭配的三个重要参数(搭配距离、搭配强度MI值、搭配强度Z值),并设定阈值,超过阈值的格式自动作为候选搭配模式。通过实验,标注的准确率为88.75%,表明本方法具有较好效果。运用该方法,发现了以往大量未被注意的句法搭配模式,对研制高质量的关联词知识库起到了积极的促进作用,对复句句法、语义的自动分析具有重要的意义。This paper provided a method of the automatic discovery of the conjunctions' collocation pattern. Built a large corpus, and it was tagged by a Chinese automatic segmenting system, and tagged and proofed the connects words artificially. Set a threshold, and regard the collocation whose parameters were above of the value as candidates for the collocation pattern. The accuracy of tagging was 88.75% ,which indicated that this method was feasible. Many syntactic patterns are discoved in the research which will promot buliding a top-quality knowledge base of connects words. And it has vital significance in automatic analysis of the syntactic and semantic of compund sentences.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.218.164.141