检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:尹倩[1]
机构地区:[1]安徽体育运动职业技术学院,安徽合肥230051
出 处:《南昌工程学院学报》2016年第1期56-60,共5页Journal of Nanchang Institute of Technology
基 金:安徽省高校优秀青年人才基金重点项目(2013SQRW125ZD);安徽省高校人文社科重点项目(SK2015A659)
摘 要:提出一种歧义字段与其所在句子语义联系为依据的中文分词交叉歧义处理方法。该方法模拟人浏览句子按照语义和词语相关度寻找消歧证据的经验,通过比较计算歧义字段与整个句子的语义相似度和语义相关度,提出基于语义扩展度的中文分词交叉歧义处理算法,进而提高分词准确率,与经典的ICTCLAS分词系统相比,切分准确率和召回率均有很大提高。This paper proposes a novel approach to overlapping ambiguity resolution in Chinese word segmentation,based on semantic correlation between overlapping ambiguity and its sentence. It simulates the habit of using semantic correlation to browse the sentences. Our experimental results show that compared with the classical ICTCLAS segmentation method,our COARSE algorithm has an obvious advantage on overlapping ambiguity resolution: the accuracy rate is increased by 3. 18 percent on average,and the average recall rate is increased by 3. 33%.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.33