检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朱艳辉[1] 刘璟[1] 徐叶强[1] 田海龙[1] 马进[1] ZHU Yanhui;LIU Jing;XU Yeqiang;TIAN Hailong;MA Jin(School of Computer and Communication, Hunan University of Technology, Zhuzhou, Hunan 412007, China)
机构地区:[1]湖南工业大学计算机与通信学院,湖南株洲412007
出 处:《计算机工程与应用》2016年第15期97-100,共4页Computer Engineering and Applications
基 金:国家自然科学基金(No.61170102);国家社科基金资助项目(No.12BYY045);湖南省教育厅重点项目(No.15A049)
摘 要:针对条件随机场分词不具有良好的领域自适应性,提出一种条件随机场与领域词典相结合的方法提高领域自适应性,并根据构词规则提出了固定词串消解,动词消解,词概率消解三种方法消除歧义。实验结果表明,该分词流程和方法,提高了分词的准确率和自适应性,在计算机领域和医学领域的分词结果 F值分别提升了7.6%和8.7%。According to the Conditional Random Field for Chinese word segmentation, the field is hard to adaptive. Acombination of CRF and domain dictionary is proposed to improve the field adaptability, and for eliminating ambiguity,this paper uses fixed word collocation, verb dictionary and word probability by the rule of word formation. The experientalresults show that this approach improves the accuracy and adaptability of the word segmentation. F value of the segmentationresults in computer and medical fields is increased by 7.6% and 8.7%.
关 键 词:中文分词 条件随机场 领域自适应 歧义消解 领域分词 逆向最大匹配算法
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222