检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]肇庆学院电子信息工程系,广东肇庆526061 [2]中山大学信息科学与技术学院,广东广州510006
出 处:《计算机应用与软件》2016年第10期94-97,共4页Computer Applications and Software
基 金:国家自然科学基金项目(61201087);广东省特色创新项目(2014KTSCX191)
摘 要:汉语中词与词之间存在固定的搭配关系,基于词语搭配关系提出一种分词歧义性消除方法。该方法先利用正向和逆向最大匹配方法进行句子预切分,并对词的歧义性进行检测和词性标注,再对歧义词与词语搭配词典进行匹配或者动宾搭配判断,实现了较为准确的文档词语歧义性消除。通过词的歧义性检测实验和词语搭配检测对比实验,该方法取得了较好的效果。In Chinese there are the fix collocation relationships between words. This paper presents a disambiguation method for Chinese segmentation based on word collocation. It firstly pre-segments the sentences by using the forward maximum matching method and backward maximum matching method,and carries out the word ambiguity detection and tags the part of speech,and then it matches the ambiguous words with word collocation dictionary or makes distinguishment on verb-object collocations,thus achieves the more accurate results of document words disambiguation. The proposed method reaches good results as shown in contrast experiments of word ambiguity detection and word collocation detection.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145