检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广西师范大学网络中心,广西桂林541004 [2]广西师范大学计算机科学与信息工程学院,广西桂林541004 [3]广西师范大学漓江学院,广西桂林541006
出 处:《广西师范大学学报(自然科学版)》2016年第1期59-65,共7页Journal of Guangxi Normal University:Natural Science Edition
基 金:国家自然科学基金资助项目(61363036;61462010)
摘 要:歧义是在基于词典的分词方法中常见的问题,以往的基于词典的分词方法往往使用双向最大匹配法获得分词结果后,通过使用上下文信息来进行歧义消解,但是对于没有上下文信息的单独语料无法进行歧义消解。本文提出一种通用的基于词频的歧义消解法,该方法是与上下文无关的,能够消解没有上下文信息的语料切分后产生的歧义,扩大了歧义消解的应用范围,简化了歧义消解的处理过程。实验表明:文本方法与传统基于词典的分词算法相比,具有更强的适用性及更高的可用性。Ambiguity is a common problem in dictionary based word segmentation methods.In the past,the word segmentation method based on dictionary often uses the bidirectional maximum matching method to get the result of word segmentation,and then carries out ambiguity resolution by using the context imformation,which cannot be used in the environment without context information.A general disambiguation method based on word frequency is presented in this paper,which is context-free and expands the application range of ambiguity resolution.Experimental results show that compared with the traditional methods of dictionary-based Chinese word segmentation,this method has a stronger applicability and higher availability.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117